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Introdução 


Percebendo ou não, o ser humano funciona baseado em modelos. Certa- 
mente, a maioria desses modelos são mentais. Por exemplo, uma das coisas 
que ocorre no processo de aprender a dirigir um carro é a construção de 
um modelo mental do carro. Além disso, o aprendiz está também desen- 
volvendo a abilidade de agir e reagir de conformidade com o modelo em 
formação de maneira a atingir o objetivo final que é a de conduzir o veículo 
em segurança. 

Uma forma simples de constatar a existência desse modelo é observar o 
que acontece quando se dirige um carro diferente: o controle de embreagem 
fica ruim, freia-se o carro bruscamente, o volante parece estar muito pesado, 
e assim por diante. O que aconteceu? O carro mudou, mas o modelo 
mental não. Assim, o cérebro toma decisões de ação e reação baseado em 
um modelo que não mais corresponde ao sistema. Motoristas experientes 
conseguem rapidamente atualizar o modelo mental, ajustando-o à realidade 
do novo veículo. Após alguns minutos, o cérebro já saberá, por exemplo, que 
a embreagem do novo carro € mais alta. Esse exemplo ilustra o que acontece 
em praticamente todos os aspectos da vida humana. Modelos, portanto, são 
fundamentais para o conhecimento, para a análise, para o controle. Não é 
de admirar que tanto tempo e esforço sejam gastos na construção de certos 
modelos. Quanto custa e demora treinar um piloto de avião? 


Infelizmente, os modelos mentais que levam tanto tempo para serem 
formados, e que são tão fundamentais para nosso dia-a-dia, têm suas limi- 
tações. Como seria possível implementar um modelo mental como parte de 
um equipamento? Que formato teria esse modelo? Qual seria o código usa- 
do para representá-lo? Fica evidente que, em muitas aplicações, além dos 
modelos mentais que há em cada um de nós, será útil dispor de modelos que 
possam ser representados por relações matemáticas. Além disso, à seme- 
Ihança dos modelos mentais, que são formados por observação e experiência, 
os modelos matemáticos devem também ser construídos a partir de dados 
observados que descrevam o comportamento do sistema em estudo. Assim, 
modelagem matemática é a área do conhecimento que estuda maneiras de 
construir e implementar modelos (matemáticos) de sistemas reais. 
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Há várias formas de classificar técnicas de modelagem. Uma delas 
agrupa os métodos em três categorias denominadas modelagem caiza branca, 
modelagem caira preta e modelagem caixa cinza. 

Na modelagem caixa branca é necessário conhecer bem o sistema em 
estudo, bem como as leis físicas que descrevem o sistema a ser modelado. 
Por essa razão esse tipo de modelagem é também conhecida como mode- 
lagem pela física ou natureza do processo ou ainda modelagem conceitual. 
Infelizmente, devido ao conhecimento e ao tempo necessários para modelar 
um sistema partindo do equacionamento dos fenômenos envolvidos, nem 
sempre é viável seguir esse procedimento. 

Identificação de sistemas é uma área de modelagem matemática que 
estuda técnicas alternativas à modelagem caixa branca. Uma das carac- 
terísticas dessas técnicas é que pouco ou nenhum conhecimento prévio do 
sistema é necessário e, conseqiientemente, tais métodos são também referi- 
dos como modelagem (ou identificação) caixa preta ou modelagem empírica. 

Em muitos casos será preferível usar técnicas de identificação para se 
obter modelos que descrevem o comportamento de um sistema. O que se 
pretende descrever com tais modelos são as relações de causa e efeito entre 
as variáveis de entrada e de saída. Nesse caso, o tipo de modelos, as técnicas 
usadas e os requisitos necessários são bastante distintos dos correspondentes 
na modelagem pela natureza do processo. 

A motivação para o estudo de técnicas de identificação de sistemas surge 
do fato que fregiientemente não se conhecem as equações envolvidas no 
funcionamento de um determinado sistema ou elas são conhecidas, mas seria 
impraticável, por limitações de tempo e recursos, levantar tais equações e 
estimar seus respectivos parâmetros. 

Uma categoria de técnicas que pode ser colocada entre a modelagem 
pela física ou natureza do processo e a identificação caixa preta é chamada 
identificação caiza cinza. As técnicas desse grupo caracterizam-se por usar 
informação auxiliar, que não se encontra no conjunto de dados utilizados 
durante a identificação. O tipo de informação auxiliar e a forma com que 
ela é usada varia muito entre as diversas técnicas disponíveis, Sendo assim, 
existem métodos de identificação caixa cinza mais “claros”, que usam mais 
informação auxiliar, e mais “escuros”, Como será mencionado ao fim desta 
introdução, o desenvolvimento de técnicas caixa cinza é um dos grandes 
desafios atuais em identificação de sistemas, 

O presente livro trata principalmente das técnicas de indentificação caixa 
preta. Na Seção 1.4 descreve-se em detalhes um exemplo de modelagem pela 
física do processo (caixa branca) de um sistema real, Mesmo considerando 
um sistema relativamente simples, ficará evidente que essa forma de mode- 
lagem restringe-se aos casos em que as equações que regem o processo são 
conhecidas. 
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A seguir será apresentado um exemplo real de identificação baseado 
em uma aplicação relativa ao setor espacial. O objetivo é ilustrar alguns 
dos pontos mencionados e prover ao leitor uma referência útil ao longo 
do estudo. À medida que forem surgindo questões, será indicado em que 
parte do livro mais detalhes sobre o assunto podem ser encontrados. Boa 
parte do desenvolvimento e figuras do exemplo a seguir foram originalmente 
apresentados em (FREITAS, 2001). 


Um Exemplo 


O processo ou planta considerado no presente exemplo é uma câmara de 
vácuo-térmico situada no LIT,! como pode ser visto na Figura 1. 


Figura 1: Vista parcial do Laboratório de Integração e Testes do Instituto 
Nacional de Pesquisas Espaciais 


As duas câmaras de vácuo-térmico — objeto de estudo no pre- 
sente exemplo — encontram-se à direita, indicadas pelo número 
1. No meio, à esquerda e indicada com o número 2, pode-se ver 
uma outra câmara de vácuo-térmico, que é bem maior, Nela são 
testados sistemas completos (satélites). Finalmente, à esquerda e 
embaixo, indicado com o número 3, encontra-se a plataforma de 
carga útil do satélite Brasilsat D2A, 


"Laboratório de Integração e Testes do Instituto Nacional de Pesquisas Espaciais 
(INPE). 
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Antes de serem colocados em órbita em um satélite, componentes fregiien- 
temente precisam ser submetidos a testes de qualificação e de balanço tér- 
mico, que visam verificar se tais componentes serão capazes de resistir às 
condições ambientais específicas. 

Um dos testes executados consistiu em submeter o componente a uma 
sequência de valores de temperatura predeterminados. Isso foi feito com 
uma câmara de vácuo-térmico, que não só formará o vácuo como também 
produzirá a sequência de temperaturas necessárias durante o teste. 

Esse cenário é típico de “testes controlados” em que uma ou mais va- 
riáveis precisam ser forçadas (controladas) a seguir um perfil previamente 
determinado. O sistema que se encarrega de garantir que a variável contro- 
lada — temperatura neste caso — esteja dentro do especificado é chamado 
controlador. O controlador pode ser um operador humano, um circuito ana- 
lógico ou mesmo um programa sendo executado em um computador digital. 
A função do controlador é determinar uma ação que será implementada 
por um atuador cuja saída é chamada variável manipulada. Um exemplo 
cotidiano é o de uma pessoa que ajusta a temperatura da água do chuveiro 
(variável controlada) atuando na posição da torneira (variável manipulada). 
Alternativamente, a vazão de água pode ser considerada com a variável ma- 
nipulada. Nesse exemplo a própria pessoa é o controlador. 

Independente de qual seja o controlador usado, é normalmente útil co- 
nhecer como a variável manipulada afeta a variável controlada. Fregiiente- 
mente, a relação entre essas variáveis é dinâmica. Isso requer, portanto, um 
modelo dinâmico para quantificar a relação de causa e efeito que existe entre 
as variáveis em questão. Essa é a motivação principal para, neste exemplo, 
obter modelos que descrevam a câmara de vácuo-térmico, cujo esquema está 
mostrado na Figura 2. 

O espécime a ser testado é colocado no interior da câmara. A câmara 
tem forma cilíndrica e é coberta internamente por uma “camisa” dividida 
em três partes: duas circulares, correspondentes às extremidades do cilindro 
e uma parte cilíndrica central, A câmara é aquecida e resfriada por gás 
que circula dentro da camisa. Assume-se que a temperatura do gás, Tg e a 
temperatura da camisa, Te, são iguais, apesar de que Tg varia um pouco mais 
rapidamente que Te. O gás é aquecido por meio de um aquecedor elétrico e 
o resfriamento é efetuado pulverizando-se nitrogênio líquido, atuando-se na 
válvula vi. 

Um sistema de controle interno, indicado pela malha fechada mostrada 
na Figura 3, determina a atuação do aquecedor ou da válvula sví para se 
obter a temperatura desejada para o gás. Essas duas ações de controle estão 
representadas pelas duas setas saindo do bloco “controlador” na Figura 3. 
Há ainda um sistema de controle de pressão do gás que atua na válvula 
do selo de controle de forma a manter a densidade do gás constante. 
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Figura 2: Esquema de uma câmara de vácuo-térmico 


A câmara de vácuo-térmico é utilizada para testar componentes 
que formarão um satélite (ARAÚJO FILHO et al., 2001). Trata-se 
de uma câmara na qual é produzido vácuo e cuja temperatura é 
forçada a seguir uma seqiência de valores pré-estabelecidos. 


Deve ser notado que a temperatura que se deseja controlar durante o 
teste não € a temperatura do gás, mas sim a temperatura do espécime sendo 
testado, Tes. Isso é conseguido por um operador externo que atua no sistema 
de controle de temperatura do gás, 


O sistema em questão é composto de uma cascata de sistemas de con- 
trole, ou seja, há um controlador externo — o operador humano — determi- 
nando o valor de referência para um controlador interno. No nível interno 
tem-se um sistema de controle de temperatura, representado pela malha 
fechada na Figura 3, e um sistema de controle de pressão de gás. No nível 
mais externo tem-se um operador que determina o valor de “temperatura 
desejada” na Figura 3 de forma que a temperatura do espécime atinja o 
valor desejado, 


Para o operador, modelar o comportamento dinâmico do sistema é im- 
portante, Conhecer o bloco “modelo” lhe permitirá determinar de forma 
mais adequada os valores de “temperatura desejada do gás” necessários pa- 
ra que Tes acompanhe o perfil de temperatura predeterminado para o teste. 
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Figura 3: Diagrama de blocos simplificado da câmara de vácuo-térmico 


Diagrama de blocos do sistema de controle da câmara de vácuo- 
térmico. O sinal de temperatura desejada refere-se à temperatura 
do gás Tg. A temperatura da camisa Te pode ser considerada 
igual à do gás. O objetivo dos testes é em geral fazer com que a 
temperatura do espécime, Tes, siga um perfil predeterminado. O 
operador humano determina o sinal de temperatura desejada com 
essa finalidade. Essa tarefa é grandemente facilitada se houver um 
modelo matemático que descreva a relação entre a temperatura da 
camisa e a temperatura do espécime. 


Deseja-se, portanto, obter modelos que representem a relação dinâmica 
entre as variáveis Te e Tes. Para isso, foram executados testes nos quais os 
sinais T e Tes foram registrados, conforme ilustrado na Figura 4. Alguns 
cuidados na execução de testes em geral e a escolha do sinal de entrada em 
tais testes são descritos nas Seções 4.3 e 4.5 e no Capítulo 12. 


Observando-se a Figura 4 percebe-se que a relação entre as variáveis 
Te e Tes é dinâmica. Isso pode ser constatado pelo fato de que a saída 
Tes não pode ser obtida simplesmente multiplicando a entrada Te por uma 
constante. Observa-se também que o formato do sinal de saída sugere a 
seguinte aproximação Tes(t) x k — er, em que k e 7 são constantes e 
t E Ré a variável tempo, Essa resposta é típica de sistemas lineares de 
primeira ordem, como será revisado no Capítulo 2, 


Como Tes é influenciada por T, principalmente por radiação, é útil ter 
no modelo tais variáveis elevadas à quarta potência. Chamando a entrada 
de u(t) = Te e a saída de y(t) = Tes, à nomenclatura adotada no livro, é 
desejável ter no modelo termos do tipo u(t)! e y(t)!. Além disso, em se 
tratando de um sistema de primeira ordem, procura-se uma função do tipo 
y = f(u,y), em que f é uma função dinâmica qualquer, Neste exemplo, 
entretanto, assume-se que f é um polinômio nas variáveis u e y. Assim 
sendo, foram geradas todas as combinações dessas variáveis até a quarta 
potência, o que resultou em 15 termos ao todo. 
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2 30 
tempo (h) 
Figura 4: Dados dos testes na câmara de vácuo-térmico 


Dados coletados durante dois testes na câmara de vácuo-térmico. 
Foi necessário interromper o primeiro teste após a vigésima quarta 
hora, indicado pela linha pontilhada. O teste foi reinicializado dias 
depois repetindo-se o último pulso aplicado no teste anterior. O 
traço contínuo indica a temperatura da camisa, Te e o tracejado a 
temperatura do espécime Tes. Essas temperaturas são médias de 
leituras de vários termopares. 


Antes de proceder à identificação propriamente dita, a unidade das va- 
riáveis foi mudada de graus Celcius para Kelvin, uma vez que o fenômeno 
de radiação é melhor caracterizado nessa unidade. É necessário determinar 
a primeira derivada de y(t), indicada por y(t). Isso foi feito seguindo-se o 
procedimento descrito no Complemento 10.2 e o resultado é mostrado na 
Figura 5, 

Para efetuar a identificação foram utilizados os dados compreendidos na 
janela que vai de 38,8 horas a 50 horas, Esse conjunto de dados é chamado 
de dados de identificação, Observando-se a Figura 4 percebe-se que essa 
janela abrange os últimos dois degraus aplicados. 

Usando as técnicas descritas no Capítulo 11, foram escolhidos automa- 
ticamente os quatro termos mais importantes para explicar os dados e seus 
parâmetros, que foram estimados usando-se as técnicas descritas no Capí- 
tulo 5, o que resultou no seguinte modelo: 


vd =2,13x10"2u! — 2,41x 1071244 + 3,46x 107104 — 2,63x10-10y2u. (1) 
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Figura 5: Derivada do sinal de temperatura 
A derivada do sinal de temperatura Tes, indicado pelo tracejado 
na Figura 4, foi estimada numericamente usando o método a ser 
descrito no Complemento 10.2. Note como o sinal desta figura é 
mais ruidoso do que o sinal de temperatura em si (curva tracejada 
na Figura 4). Essa “amplificação de ruído” é uma das principais 
limitações na identificação de modelos em tempo contínuo, princi- 
palmente para sistemas de ordem mais elevada em que sucessivas 
derivadas precisam ser estimadas. 


É interessante notar que o algoritmo utilizado foi capaz de reconhecer a 
importância dos termos quárticos, ou seja, os termos u(t)! e y(t)!. Escolher 
a estrutura de um modelo de forma automática é desejável, pois nem sempre 
se saberá a priori que tipo de termos são os mais adequados. Esse assunto 
será abordado nos Capítulos 10, 11 e 12, entre outros. 

A importância de se escolher corretamente a estrutura do modelo, ou 
seja, determinar quais são os termos que devem compor o modelo, pode 
ser ilustrada considerando-se o modelo de 12 termos obtido utilizando-se o 
mesmo conjunto de dados 


y = -7,387x10Hy! - 2,58x 101044 + 2,90x10779º 
+2,69x 1074u? — 1,27x 1074y? — 8,10x10-2u 
+2,67x10"4yu + 8,21x10-Hy2u? — 9,57x 1077 yu? 
+1,00x 10º yu? + 5,98 — 2,43x 1077, (2) 


A próxima etapa é verificar a capacidade que os modelos das equações en- 
contradas (1) e (2) têm de representar o processo estudado. Foram tomados 
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os sinais de entrada e saída de outro intervalo, ou janela, (de 2,2 horas a 
16,7 horas) e o mesmo sinal de entrada (7 medido) foi aplicado aos modelos 
(1) e (2), que foram simulados a seguir, 


Os dados utilizados para verificar o desempenho ou a validade do modelo 
são chamados de dados de validação. A preocupação de se utilizar um 
conjunto de dados para testar o modelo que seja diferente dos dados de 
identificação é um procedimento básico na validação de modelos, assunto 
que será tratado no Capítulo 13, 


As respostas simuladas dos modelos (1) e (2) foram posteriormente com- 
paradas com a resposta medida do sistema, Tes. Esses sinais estão mostrados 
na Figura 6a e 6b, respectivamente. Conforme pode ser visto, o modelo (2) 
não descreve bem as relações de causa e efeito entre os sinais de temperatura 
utilizados. Uma das possíveis razões para isso é que a estrutura do modelo 
não foi bem determinada. Em particular, há mais termos do que o necessá- 
rio — isso fica evidente ao se comparar as estruturas e os desempenhos dos 
modelos (1) e (2) —, problema conhecido como sobreparametrização. 


Não há dúvida de que os modelos (1) e (2) são não-lineares. Mui- 
tas representações não-lineares poderiam ter sido utilizadas, algumas delas 
são brevemente apresentadas no Capítulo 10. As Egs.1 e 2 são contínu- 
as no tempo, mas representações discretas no tempo também podem ser 
utilizadas. 


A motivação para usar modelos em tempo discreto pode ser apreciada 
ao se observar que o processo de estimar numericamente as derivadas de 
um sinal amplifica o ruído no sinal, como pode ser constatado comparando 
o sinal Tes mostrado pela linha tracejada na Figura 4 com sua primeira 
derivada, ilustrada na Figura 5. 


No caso de sistemas de ordem mais elevada, por exemplo ordem três, 
torna-se necessário estimar não apenas a primeira, mas também a segunda e 
a terceira derivadas de um sinal, Nesse caso, o ruído originalmente presente 
no sinal medido é amplificado ao ponto de tornar impraticável a identificação 
de modelos contínuos em certos casos, Isso explica a razão pela qual a teoria 
de identificação de sistemas foi originalmente desenvolvida no contexto de 
sistemas discretos. Esse tipo de modelo, portanto, será o alvo dos Capítu- 
los 5 a 8, bem como do restante do presente exemplo. 


Não só é possível, mas também é viável obter modelos em tempo contí- 


nuo para sistemas reais, conforme ilustrado neste exemplo e nos estudos de 
caso das Seções 16,2 e 16,11. 
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FiGuRa 6: Validação de modelos da câmara de vácuo-térmico 


Em ambos os gráficos, a linha cheia é o sinal medido da tempe- 
ratura na câmara de vácuo-térmico e as linhas tracejadas são as 
saídas estimadas usando os modelos, O gráfico (a) corresponde 
ao modelo da equação (1), enquanto o gráfico (b), ao modelo (2). 
A janela mostrada corresponde ao período entre 2,2 horas e 16,7 
horas, na Figura 4, Esses dados são diferentes dos utilizados na 
obtenção do modelo, O desempenho ruim do modelo (2) deve-se 
ao fato de que a estrutura do mesmo não é adequada, 


| 
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A fim de construtr os modelos discretos, seguiu-se um procedimento 
semelhante ao usado para obter os modelos contínuos (1) e (2). Inicial- 
mente foram gerados os termos candidatos. Esse conjunto, também de 15 
elementos, consiste de todas as combinações dos termos u(k = 1) e y(k — 1) 
até a quarta potência. Foi utilizado um algoritmo, descrito no Capítulo 11, 
para escolher os termos mais importantes de forma automática utilizando 
um critério previamente definido e, portanto, não são necessariamente os 
mais importantes de forma absoluta. O modelo obtido foi: 


vk) = 1,00y(k = 1) = 3,61x10-Su(k — 1) — 2,06x10-Hy(k — 1)! 
+1,94x 10-Hu(k — 1)4. (3) 


O desempenho do modelo (3) pode ser verificado na Figura 7. É interes- 
sante observar que, no caso do modelo discreto, o algoritmo de escolha de 
termos também incluiu automaticamente os termos quárticos, u(k — 1)! e 
y(k — 1)!. Esse procedimento será mais formalmente chamado de escolha 
ou determinação de estrutura e é abordado nos Capítulos 11 e 12. 
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Figura 7; Validação de modelo discreto da câmara de vácuo-térmico 


A linha cheia é o sinal medido da temperatura na câmara de vácuo- 
térmico e a linha tracejada é a saída do modelo (3). Apesar de um 
pouco pior, o desempenho desse modelo é próximo ao do modelo 
(1), conforme pode ser constatado comparando-se esta figura com 
a Figura 6a, 


Como as representações usadas nos modelos (1) e (3) são distintas, os 
coeficientes de tais modelos não são diretamente comparáveis. Contudo, 
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as estruturas de tais modelos têm aspectos comuns (como de fato deveria 
sor), tais como a ordem (ambos são de primeira ordem) e a presença de 
termos quárticos. Após algumas operações algébricas, o modelo (3) pode 
ser reescrito da seguinte forma: 


nto Luto!) = 3,61x10-u(k=1) — 2,06x10-2y(k— 1)! 


+1,94x10-Pu(k= 1). (4) 


O lado esquerdo da Eq.4 é a aproximação implícita de Euler para a 
derivada primeira (ver Eq. 1.40), em que o denominador corresponde ao 
período de amostragem utilizado na coleta dos dados. Expresso dessa 
maneira, o modelo discreto se parece com o modelo contínuo (a deriva- 
da da temperatura é igual a uma combinação linear de variáveis, duas delas 
elevadas à quarta potência) e os coeficientes dos termos quárticos são pró- 
ximos: o coeficiente de u(t)! na Eq.1 é 2,13 x 10-12 x 1,94 x 10-22, em 
que o último valor é o coeficiente de u(k — 1)! na Eq. 4. O mesmo se aplica 
para os coeficientes dos termos quárticos da saída. Conclui-se, portanto, 
que representações diferentes resultarão em parâmetros diferentes, no en- 
tanto as relações dinâmicas entre as variáveis do modelo continuarão sendo 
semelhantes. Em casos simples, como o descrito aqui (ver também o Exem- 
plo 8.5.1), é possível obter uma relação entre tais coeficientes. Em outros 
casos, como nas representações não-lineares descritas no Capítulo 10 e ilus- 
tradas no Capítulo 16, isso não será possível em geral. Entretanto, o fato 
de não haver uma clara correspondência entre os parâmetros do modelo 
identificado e os parâmetros físicos não invalida o modelo. 

No exemplo descrito, informação a priori — ou conhecimento prévio — 
foi utilizada pelo menos em dois aspectos. Primeiramente, decidiu-se gerar 
termos candidatos até grau quatro por saber de antemão que o fenômeno 
de transmissão de calor por radiação está presente no sistema. Em segundo 
lugar, sabendo que se trata de um sistema em que a entrada e saída estão 
relacionados por fenômenos de transmissão de calor, decidiu-se restringir a 
ordem do modelo a um. Como essas duas decisões — escolha da ordem 
do modelo e a escolha do máximo grau dos termos a serem considerados 
— foram baseadas no conhecimento prévio dos fenômenos envolvidos, o 
procedimento pode ser classificado como caixa cinza, ainda que bastante 
escuro, 

Um procedimento caixa cinza mais claro poderia utilizar informação 
concernente à transferência de calor, Para ver isso, basta lembrar que a 
taxa de troca de energia por radiação entre um corpo e o ambiente é pro- 
porcional à diferença de temperaturas (do corpo e do ambiente) elevada 
à quarta potência. Sendo assim, os coeficientes dos termos u(k — 1)! e 
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v(k = 1)! deveriam ser Iguais em módulo e com sinais opostos. Como será 
descrito no Complemento 5.9, essa restrição pode ser facilmente imposta 
durante o procedimento de estimação de parâmetros, Além disso, analisan- 
do a Pigura 7 percebe-se que a resposta do modelo normalmente está acima 
dos valores medidos. Essa tendência sugere a inclusão de uma constante 
no modelo, Procedendo assim, e reestimando os parâmetros, obtém-se o 
seguinte modelo: 


y(k) = 3,27x102 +1,00y(k — 1) — 8,51x10"Pu(k — 1) 
—1,98x 10H y(k — 1)! + 1,98x 10-Hu(k — 1)*. (5) 


Observe que, por causa da restrição imposta — motivada pelo conhecimento 
da equação que rege o fenômeno de radiação —, os coeficientes dos termos 
u(k — 1)! e y(k — 1)! são idênticos em módulo e com sinal trocado. A 
simulação do modelo (5) para um outro sinal de entrada é comparada ao 
sinal efetivamente medido na Figura 8. 
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Figura 8; Validação de modelo caixa cinza da câmara de vácuo-térmico 
À linha cheia é o sinal medido da temperatura na câmara de vácuo- 
térmico e a linha tracejada é a saída do modelo (5). 


Nesse exemplo enfatizou-se a classificação do procedimento seguido em 
termos de ser caixa preta ou caixa cinza. Uma das razões para isso é sa- 
lientar que o desenvolvimento de técnicas de identificação que possam ser 
classificadas como sendo do tipo caiza cinza é um dos grandes alvos atuais 
na área de identificação de sistemas. 
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O quadro da Figura 9 ilustra uma maneira de entender a evolução da 
área nas últimas décadas. Nesse quadro, os blocos com quinas arredondadas 
referem-se a problemas cuja solução serviu de motivação para buscar novas 
ferramentas e técnicas, A linha do tempo é de cima para baixo indicando, 
por exemplo, que a parte inferior da figura refere-se a desenvolvimentos 
mais atuais. 
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(Os modelos podem ser usados de forma mais adequada 


Tais representações e algoritmos seguem a abordagem 
para extrair informação dos dados a respeito do sistema. ai ê 


caixa preta. 


FIGURA 9: Quadro ilustrativo da evolução da Identificação de Sistemas 


As dificuldades, indicadas nesta figura por meio de caixas com 
quinas arredondadas, servem de motivação para buscar alternati- 
vas, indicadas nas caixas com quinas agudas. O bloco com duas 
molduras finas representa a modelagem caixa branca. A Seção 1.4 
detalha um exemplo dessa forma de modelagem. Os blocos com 
moldura escura e quinas agudas indicam modelagem caixa preta. 
Os Capítulos 3 a 8 tratam de técnicas que se encaixam no primei- 
ro desses blocos, sendo que o segundo e o terceiro são abordados 
nos Capítulos 10, 11 e 16, Finalmente, o bloco com três moldu- 
ras finas representa a modelagem caiza cinza, assunto ao qual foi 
dedicado o Capítulo 15. 
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O quadro inicia com o desafio de construir modelos matemáticos que 
descrevam fenômenos observados. Seguindo-se a linha central do qua- 
dro, encontram-se três níveis de técnicas: a modelagem caixa branca, a 
identificação caixa preta de modelos lineares e a identificação caixa preta 
de sistemas não-lineares. Esses grupos estão indicadas pelo bloco branco e 
pelos dois blocos com moldura escura e quinas agudas. 

Para cada um desses níveis, constam comentários sobre suas princi- 
pais vantagens, desvantagens e principais características relacionadas à sua 
estrutura e parâmetros. As principais desvantagens de uma determinada 
família de técnicas servem de motivação para a busca e desenvolvimento de 
novas alternativas. Por essa razão, as dificuldades associadas aos respectivos 
níveis aparecem dentro dos blocos com quinas arredondadas. 

De forma geral, as técnicas de modelagem caixa branca antecederam as 
técnicas de identificação de sistemas e, dentre estas, as técnicas relacionadas 
a sistemas não-lineares são mais recentes na literatura. Esse fator cronoló- 
gico está representado no quadro da Figura 9 no segienciamento dos três 
níveis de técnicas mencionados acima. Ainda há importantes contribuições 
sendo publicadas em todos esses níveis. 

Os dois grandes quadros inferiores representam duas vertentes atuais 
na pesquisa de identificação de sistemas. Uma das formas de classificar os 
esforços atualmente evidados na identificação de sistemas não-lineares será 
descrita nos dois próximos parágrafos. 

Por um lado, há diversos trabalhos que têm por objetivo apresentar 
novas representações ou novos algoritmos de determinação de estrutura e 
estimação de parâmetros (muitas vezes referidos como algoritmos de treina- 
mento). Tais representações e algoritmos são, normalmente, mais flexíveis 
e eficientes à custa de um aumento de complexidade. Tais técnicas seguem 
a filosofia caiza preta e seus benefícios são em geral de caráter numérico. 
Os Capítulos 10 e 11 trazem alguns resultados nessa direção. 

Por outro lado, existe o esforço de tentar associar a estrutura de mo- 
delos e seus parâmetros ao tipo de regimes dinâmicos que podem produzir. 
O estabelecimento de relações entre modelo e dinâmica permite em alguns 
casos utilizar informação auxiliar no processo de identificação. Isso sugere 
classificar tais procedimentos como sendo do tipo caiza cinza. Seus prin- 
cipais benefícios são o melhor entendimento do funcionamento do modelo, 
o melhor uso de informação auxiliar e, frequentemente, um melhor desem- 
penho dinâmico dos modelos. O Capítulo 15 descreve alguns resultados 
recentes nessa área. 

Antes de encerrar esta introdução, deseja-se chamar a atenção para dois 
aspectos do exemplo abordado. Em primeiro lugar, as técnicas utilizadas 
não são específicas para a modelagem de câmaras de vácuo-térmico. Em 
segundo lugar, entretanto, foi possível melhorar o desempenho dos modelos 
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utilizando informações adicionais peculiares ao processo. Portanto, as téc- 
nicas a serem apresentadas e discutidas nas próximas páginas não se res- 
tringem a uma área específica do conhecimento, sendo aplicáveis a qualquer 
processo do qual se tenham dados dinâmicos. Por outro lado, o conhe- 
cimento de aspectos peculiares ao processo modelado será sempre útil e 
bem-vindo, Sendo assim, a área de Identificação de Sistemas transcende 
as fronteiras de disciplinas específicas apresentando desafios e oferecendo 
soluções às mais diversas áreas. 
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Modelagem Matemática 


1.1 Introdução 


Modelagem matemática é a área do conhecimento que estuda maneiras de 
desenvolver e implementar modelos matemáticos de sistemas reais. Há vá- 
rias formas e técnicas de se obter modelos matemáticos, uma delas é a 
modelagem caixa branca. Nesse caso, faz-se necessário conhecer a fundo o 
sistema a ser modelado. Além de estar bem familiarizado com o sistema, 
para esse tipo de modelagem é necessário conhecer as relações matemá- 
ticas que descrevem os fenômenos envolvidos. Modelagem caixa branca 
é também conhecida como modelagem pela física ou natureza do processo 
ou ainda modelagem fenomenológica ou conceitual. Infelizmente, devido ao 
conhecimento e tempo necessário para modelar um sistema partindo do 
equacionamento dos fenômenos envolvidos, nem sempre é viável seguir esse 
procedimento de modelagem, 

Identificação de sistemas é uma área do conhecimento que estuda técni- 
cas alternativas de modelagem matemática, Uma das características dessas 
técnicas é que pouco ou nenhum conhecimento prévio do sistema é neces- 
sário e, consegijentemente, tais métodos são também referidos como mode- 
lagem (ou identificação) caixa preta ou modelagem empírica. Em muitos 
casos será preferível usar técnicas de identificação de sistemas. Nesse caso, o 
tipo de modelos, as técnicas usadas e os requisitos necessários são bastante 
distintos dos análogos na modelagem pela natureza do processo. 

O objetivo deste capítulo é apresentar conceitos básicos que serão úteis 
no estudo de técnicas de identificação, Um modelo matemático de uma 
Planta piloto de bombeamento de água será desenvolvido partindo-se das 
equações que governam os fenômenos envolvidos. O restante do livro é 
dedicado a técnicas de identificação e por comparação com o exemplo da 
Seção 1,4; espera-se que o leitor perceba claramente as diferenças entre essas 
duas filosofias de modelagem matemática. 
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1.2 Alguns Conceitos Básicos 


O assunto que será tratado agora é modelagem matemática de sistemas. 
Mas, o que é um modelo matemático? Um modelo matemático de um siste- 
ma real é um análogo matemático que representa algumas das características 
observadas em tal sistema. Evidentemente, há outros tipos de modelos além 
dos modelos matemáticos. Por exemplo, a maquete de um edifício também 
é um modelo, ainda que não seja matemático, É importante perceber que 
uma maquete possui algumas das características da construção real, mas 
não todas. A mesma observação é válida para os modelos matemáticos. 
A pergunta é: quais características do sistema devem ser representadas de 
maneira aproximada pelo modelo? A resposta a esta pergunta não é única 
e depende do objetivo para o qual o modelo está sendo desenvolvido. Ape- 
sar de poder desenvolver modelos com propriedades bastante diferentes, no 
presente livro uma das características do sistema que se deseja representar 
com o modelo é o comportamento dinâmico, ou seja, a evolução temporal 
do sistema. 

À semelhança da última pergunta no parágrafo anterior, a pergunta “pa- 
ra que serve um modelo?” também pode ser respondida de muitas formas. 
Modelos matemáticos têm sido utilizados ao longo da história para os mais 
diversos fins, como, por exemplo: entender e explicar fenômenos observados 
tanto na natureza quanto em sistemas sociais, biomédicos, equipamentos 
etc.; projeto de sistemas de monitorização e controle; predição; estimação 
de estados; simulação e treinamento, como, por exemplo, os simuladores de 
vôo. Portanto, a pergunta acima deverá ser respondida no contexto de cada 
problema de modelagem. 

Uma outra questão importante é o da escolha do tipo de modelo a ser 
utilizado, Como antes, tal escolha não é única e depende do objetivo em vis- 
ta, do volume de informação e tempo disponível para desenvolver o modelo. 
Antes de mencionar brevemente alguns tipos comuns de modelos, algumas 
considerações, comumente feitas em problemas de modelagem, serão lista- 
das e comentadas, 


1.2.1 Considerações freqlientemente feitas em modelagem 


Dois fatos devem sempre estar presentes ao modelador matemático, Em pri- 
meiro Jugar, o modelo desenvolvido para um determinado sistema é apenas 
uma representação aprozimada. Conseqientemente, não existe o modelo do 
sistema, mas sim uma família de modelos com características e desempenhos 
variados. A decisão de qual desses modelos escolher é um dos problemas não 
triviais com o qual o modelador se defrontará, Em segundo lugar, o modelo 
é uma aproximação de apenas algumas características do sistema real. Em 
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outras palavras, pretender desenvolver um modelo que contenha muitas das 
características do sistema real é um alvo normalmente inatingível. 

A fim de desenvolver modelos aproximados, normalmente fazem-se con- 
siderações simplificadoras. Quando o modelo estiver pronto e for testado, 
se o seu desempenho for considerado inadequado, uma coisa a fazer é rea- 
valiar a pertinência das considerações feitas durante o seu desenvolvimento. 
Algumas considerações comumente feitas durante a identificação de modelos 
são comentadas a seguir. 

Linearidade. Uma consideração freqiientemente feita é a de se supor que 
o sistema sendo modelado comporta-se de forma aproximadamente linear. 
Tal suposição é normalmente verificada observando-se o comportamento de 
um sistema numa faixa relativamente estreita de operação. 

Formalmente, diz-se que um sistema é linear se ele satisfaz o princípio da 
superposição. Para entender esse princípio, considere um sistema que ao ser 
excitado pela entrada u;(t) produz a saída y (t) e quando excitado por u2(t) 
produz ya(t). Se tal sistema satisfizer o princípio da superposição então, 
quando excitado por a u;(t) + bua(t), sua saída será a yi(t) + bya(t), sendo 
a e b constantes possivelmente complexas. Informalmente, pode-se dizer 
que um sistema linear tem o mesmo tipo de comportamento, independente 
do ponto de operação. 

A consideração de linearidade normalmente simplifica muito o modelo 
a ser desenvolvido. Entretanto, há situações em que esta consideração não 
é adequada, como, por exemplo, para sistemas com dinâmica fortemente 
bilinear (que não podem ser descritos adequadamente por um único mo- 
delo linear, independentemente de quão estreita seja a faixa de operação 
considerada); e no caso em que se deseja estudar características dinâmicas 
não-lineares do sistema, tais como oscilações e bifurcações. 


Exemplo 1,2,1, Linearidade — um sistema estático 


Considere a equação da reta y = bz. Este “sistema” é estático porque 
é descrito por uma equação algébrica (ver Seção 1.2.2). Além de estático, 
esse sistema é linear pois satisfaz o princípio da superposição. Por exemplo, 
se 7; =2, então y = 10; sex, = -3, então yy = -15. O princípio 
da superposição estabelece que se xy = 47, + 5z3 = —7, então tem-se a 
seguinte relação: yy = 4y + 5yp = —35. Por outro lado, yy = 523 = —35, 
que é precisamente o resultado obtido usando-se o princípio da superposição, 
ou seja, o sistema é de fato linear, 

Um outro exemplo é y = 2 + 5x, que também é a equação de uma reta. 
É fácil de verificar que tal sistema não é mais linear (veja Exercício 1.2). O 


Digitalizado com CamScanner 


”M 1 MODELAGEM MATEMÁTICA 


Exemplo 1.2.2. Lincaridade — um sistema dinâmico 


Considere a seguinte equação diferencial: 
dy 
Su(t) + y(t) — 10u(t) = 0, (1.1) 


sendo que y(t) e u(t) representam a saída e a entrada de um sistema 

hipotético. A equação acima é não-linear, uma vez que a derivada primeira 

do sinal de saída é multiplicada pela entrada, e não por uma constante. 
Uma equação diferencial linear semelhante é: 


TE + ylt) — Ko) =0, (1.2) 


que pode ser reescrita na forma de uma função de transferência de primeira 
ordem como: H(s) = K/(r s + 1). Funções desse tipo serão estudadas no 
Capítulo 2. No caso do sistema representado pela Eq. 1.1, a “constante de 
tempo” poderia ser expressa como r(u) = Su(t). Nesse caso, como T(u) 
não é constante, não se pode falar, de forma matematicamente rigorosa, 
em constante de tempo. Porém, pela Eq. 1.1 percebe-se que a velocidade 
com que o sistema responde a variações na entrada u(t) depende do próprio 
valor de u(t). Para valores baixos de entrada, o sistema responde mais 
rapidamente do que para valores maiores. Caso a constante de tempo fosse 
fixa, o sistema seria linear. [mm 


Invariância no tempo. A consideração de invariância temporal implica 
que o comportamento do sistema sendo modelado não varia com o tempo. 
Isto não significa que as variáveis do sistema têm valores constantes. Pelo 
contrário, normalmente os valores das variáveis que caracterizam um siste- 
ma flutuam com o tempo, sendo que tal evolução temporal é determinada 
por uma lei. Normalmente, refere-se a essa lei como sendo a dinâmica do 
sistema. Portanto, ser invariante no tempo não quer dizer que o sistema 
está “estático”, mas certamente implica que a dinâmica que está regulando a 
evolução temporal é a mesma, Essa é uma das premissas mais importantes 
em modelagem matemática, a saber, que a dinâmica não se altera signifi- 
cativamente no período de tempo em que se considera o sistema, Portanto, 
faz sentido representar tal dinâmica usando-se um modelo matemático. 

Infelizmente, a maioria dos sistemas reais varia ao longo do tempo, seja 
em função de flutuações de variáveis que afetam a sua operação (por exem- 
plo, flutuações de temperatura ao longo do dia ou do ano), seja como con- 
segiiência de envelhecimento ou simplesmente devido a uma forma diferente - 
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de operação (por exemplo, a dinâmica associada aos batimentos cardíacos 
é diferente se o paciente está dormindo ou se está acordado). 

Formalmente, diz-se que um sistema é invariante se um deslocamento no 
tempo na entrada causa um deslocamento no tempo na saída. Suponha-se o 
caso discreto em que um sistema com entrada u(k) e saída y(k). Se esse sis- 
tema for invariante no tempo, u(k— ko) produzirá y(k— ko). Informalmente, 
diz-se que um sistema é invariante no tempo se sua dinâmica (incluindo tam- 
bém seu ganho estático) não varia com o tempo. Considerando-se o sistema 
invariante no tempo, em muito simplifica o problema de modelagem, uma 
vez que a relação causa e efeito não varia significativamente com o tempo e 
apenas um modelo é requerido para representá-lo. 

Um conceito relacionado ao de invariância é o de estacionariedade. Este, 
entretanto, é mais usado no contexto de sinais e processos estocásticos e é 
definido no Apêndice C. A identificação de sistemas não-estacionários foi 
investigada em (ARAÚJO, 2006; DUARTE, 2006). 


Exemplo 1.2.3. Invariância! 
Seja o sistema y(t) = sen(u(t)). Portanto, para uma entrada w(t) a 
saída será y = sen(ui(t)). Supondo que uma segunda entrada seja gerada 


como sendo o deslocamento temporal da primeira, ou seja, u2(t) = u(t-to). 
A saída nesse caso é 


tal) = sen(ua(t)) = sen(u (é = to). 
Da definição do sistema, tem-se também 


vi(t = to) = sen(u (t — to)), 


e como ya(t) = yi(t — to) o sistema é invariante, 
Por outro lado, considere-se o sistema y(t) = tu(t) e as mesmas entradas 
acima. Nesse caso, pode-se escrever 


(e) 
valt) 


tu(t) 
tua(t) = tu(t — to). 


Deslocando a saída no tempo, conforme feito com a entrada, tem-se 
vi(t-to) = (t=toJui(t—to) £ ya(t), o que indica que o sistema y(t) = tu(t) 
*Oprenneim; WiILLSKY, 1983. p. 42, 
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não é invariante no tempo. Na realidade, neste exemplo, não seria necessário 
o desenvolvimento acima para se chegar a essa conclusão, uma vez que a 
relação entre a saída e a entrada do sistema explicitamente depende do 
tempo. (8) 


Concentração de parâmetros. A consideração de concentração de 
parâmetros resulta em equações diferenciais ordinárias (ao invés de equa- 
ções diferenciais parciais, para o caso de sistemas a parâmetros distribuídos). 
Esse tipo de representação pressupõe que as variáveis de interesse variam 
apenas com o tempo e não no espaço. Em outras palavras, modelos a pa- 
râmetros concentrados descrevem o comportamento do sistema num único 
ponto do espaço. Por outro lado, equações diferenciais parciais descrevem 
o sistema tanto no tempo (quando observamos) quanto no espaço (onde 
observamos). Este livro estará voltado para modelos a parâmetros concen- 
trados, mas a seguir é apresentado um exemplo de um sistema a parâmetros 
distribuídos, modelado por uma equação diferencial parcial. 


Exemplo 1.2.4. Sistema a parâmetros distribuídos ? 


Seja uma viga presa ao teto e com a extremidade inferior livre. A 
posição de qualquer parte da viga é determinada pela sua distância x ao teto. 
Suponha que na extremidade livre seja aplicado um conjugado. Deseja-se 
conhecer como varia o ângulo de torção 0 como consegiiência do conjugado. 
Claramente, O vai depender, não apenas do tempo, mas também da posição 
(ou seja, da distância ao teto) considerada, resultando assim numa equação 
diferencial parcial do tipo 


920 920 
o = op 8) 
sendo que K é uma constante que depende da geometria e material da viga. 
[a] 


1.2.2 Tipos de modelos 


Seria impossível tentar descrever todos os tipos de modelos matemáticos. 
A seguir, mencionam-se alguns dos mais comuns. 

Modelos estáticos e dinâmicos. Modelos estáticos relacionam variáveis 
sem quantificar sua dependência temporal. Se a evolução temporal de um 
sistema é desejada, modelos dinâmicos devem ser usados. Modelos estáticos 


?DOEBELIN, 1980. p. 146. 
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são normalmente descritos por equações algébricas, ao passo que modelos 
dinâmicos são compostos por equações diferenciais (ou a diferenças, no caso 
discreto no tempo), sendo que tais modelos podem também incluir equações 
algébricas. Todo sistema real é, em última análise, dinâmico. A opção por 
descrever um sistema real por um modelo estático é viável quando a sua 
dinâmica (variações no tempo) não é relevante. Esse é o caso quando a 
dinâmica é muito rápida ou muito lenta, se comparada com a escala de 
tempo de interesse. 


O sistema do Exemplo 1.2.3 é claramente um sistema estático, uma 
vez que variações em u(t) são imediatamente refletidas em y(t). Por outro 
lado, a Eq. 1.3 representa um sistema dinâmico para o qual variações em 0, 
resultantes da ação do conjugado na extremidade livre da viga, não ocorrem 
instântaneamente. 


Modelos discretos e contínuos. Aqui os termos discreto e contínuo se 
referem ao tempo. Modelos dinâmicos contínuos são descritos por equações 
diferenciais e representam a evolução do sistema continuamente no tempo, 
como, por exemplo, o modelo da Eq. 1.1. Em contraste, modelos dinâmicos 
discretos no tempo representam a evolução do sistema em instantes dis- 
cretos e são descritos por equações a diferenças. A maioria dos métodos 
determinísticos de identificação (ver Capítulo 3) fornece modelos contínuos, 
ainda que os dados sejam obtidos em instantes específicos no tempo, ou 
seja, os dados são amostrados. Por outro lado, a grande maioria dos méto- 
dos estocásticos de identificação resultam em modelos discretos no tempo, 
ainda que praticamente todos os sistemas reais sejam contínuos no tempo. 


Exemplo 1.2.5. Modelo discreto de um sistema biológico 3 


Considere a população de certos besouros. Os ovos de tais insetos eclo- 
dem tornando-se larvas e, depois de duas semanas, fecham-se num casulo do 
qual emergem posteriormente na forma adulta, como besouros. A população 
de tais insetos é, ainda que indiretamente, composta pela população de lar- 
vas, L, pelo número de casulos, C, e pelo número de besouros, B. Essa 
população será considerada em períodos de duas semanas e o instante de 
“tempo” em questão será indicado pelo número inteiro k. Assim, por exem- 
plo, L(k) é a população de larvas num determinado instante no tempo e 
B(k +1) é o número de besouros duas semanas depois. Um modelo simples 
para descrever a população desses insetos é 


3ALLIGOOD et al., 1997, p. 39, 
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L(k+1) = vB(k) 
C(k+1) = (kt — qu) 
B(k+1) = C(k)[L = pc] + BR) — po), (1.4) 


sendo que v é a taxa de natalidade, 41, Hc € Hp São as taxas de mortalidade 
das larvas, casulos e dos besouros, respectivamente. 

O modelo (1.4) é bastante elementar e simples de entender. A primeira 
equação estabelece que o número de larvas num determinado momento 
depende do número de besouros (insetos adultos) duas semanas antes. A 
segunda equação indica que o número de casulos num determinado tempo 
é igual ao número de larvas existentes duas semanas antes menos o número 
de larvas que morreram. Finalmente, a última equação estabelece que o 
número de besouros num determinado instante é igual ao número de casu- 
los existentes duas semanas antes, menos o número de casulos que morre- 
ram, mais o número de besouros que sobreviveram nas últimas duas sema- 
nas. Claramente, o modelo acima é discreto. Note que o modelo não pode 
informar qual era a situação cinco dias antes nem dois dias depois do tempo 
considerado. Apesar de o processo real ser contínuo no tempo, o modelo 
acima é discreto com período de amostragem igual a duas semanas. [m| 


Modelos autônomos e não autônomos. Diz-se que um modelo é autôno- 
mo se tal modelo não depende explicitamente do tempo. No contexto de 
modelagem, serão chamados de autônomos os modelos que não contêm de 
forma explícita sinais de entrada gerais. Um modelo com pelo menos uma 
entrada geral será denominado não autônomo. 


Exemplo 1.2.6. Modelo não autônomo de um sistema biológico 


Considere mais uma vez o modelo da população de besouros (1.4). Esse 
modelo é autônomo, uma vez que não há qualquer perturbação temporal 
externa ao modelo. 

Suponha que se deseje estudar o efeito de um certo agrotóxico sobre 
a dinâmica da população de besouros. A(k) é a quantidade média de 
agrotóxico aspergido por metro quadrado. Considera-se que tal agrotóxico 
somente afeta as larvas matando uma certa quantidade delas. O modelo 


“Em alguns casos, uma mudança de variáveis pode ser feita de forma a representar 
um sistema não autônomo como autônomo, para isso aumenta-se de um a dimensão 
do espaço de estados. 
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(1.4) pode ser alterado a fim de incorporar essas mudanças da seguinte 
forma: 


L(k+1) = vB(k) 
C(b+1) = LI — pa A(K)) 
B(k+1) = C(L = ue) + BIB — pu), (1.5) 


sendo que ja é a taxa de mortalidade devida exclusivamente à ação do 
agrotóxico. O modelo agora passou a conter A(k), que é um sinal externo, 
às vezes chamado de sinal “forçante”, ou entrada. O modelo (1.5) é não 
autônomo. [n 


Modelos monovariáveis e multivariáveis. Um modelo com mais de uma 
entrada ou mais de uma saída é denominado multivariável. Modelos mono- 
variáveis são aqueles que representam a relação causa e efeito de apenas um 
par de variáveis, ou seja, de uma entrada para uma saída. Na literatura, 
modelos monovariáveis são conhecidos como modelos SISO (single input, 
single output). Por outro lado, modelos multivariáveis podem ser classifi- 
cados dependendo do número de entradas e saídas. Modelos de múltiplas 
entradas e uma saída são referidos como modelos MISO (multiple inputs, 
single output); modelos com uma única entrada e mais de uma saída são 
denominados modelos SIMO (single input, multiple outputs); e modelos com 
mais de uma entrada e mais de uma saída são chamados de modelos MIMO 
(multiple input, multiple outputs). Deve ser notado que o uso de modelos 
monovariáveis não implica em que o sistema real tenha apenas uma entrada 
e uma saída. De fato, a maioria dos sistemas reais tem várias entradas e 
várias saídas, muitas delas possivelmente desconhecidas. 


Exemplo 1.2.7. Modelos monovariáveis e multivariáveis 


O modelo da Eq.1.1 é um modelo monovariável de uma entrada, u(t) 
e uma saída y(t), portanto é um modelo SISO. O modelo (1.5) pode ser 
classificado da mesma maneira desde que apenas uma das variáveis L, O ou 
B seja considerada a saída do modelo. Entretanto, é possível (e até mais 
natural) considerar tanto L quanto C' e B como saídas do modelo e, nesse 
caso, a Eq. 1.5 é classificada como um modelo de uma entrada e múltiplas 
saídas, ou seja, um modelo SIMO. D 


Modelos determinísticos e estocásticos. Modelos determinísticos são aque- 
les em que as variáveis e parâmetros são tratados como sendo determiniís- 
ticos, ou seja, não são variáveis aleatórias. Por outro lado, os modelos es- 
tocásticos lidam com as diversas fontes de incerteza presentes em qualquer 
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situação real por meio do uso de variáveis aleatórias. Consegiientemente, 
a saída de um modelo estocástico não é, a rigor, um número determinís- 
tico, mas sim uma variável aleatória. Em outras palavras, um modelo es- 
tocástico pode ser interpretado como sendo uma aproximação de alguma 
função densidade de probabilidade condicional, que relaciona a saída a uma 
determinada seqiiência de valores históricos, e sua saída como sendo, por 
exemplo, a esperança matemática de uma variável aleatória. Na prática, 
isso significa que para um modelo estocástico, ao contrário do que para 
um modelo determinístico, a saída no instante t não pode ser exatamente 
determinada a partir de dados referentes ao passado, tp < t. Esse tipo de 
interpretação será retomada no contexto de filtragem, no Capítulo 9. 

A maioria dos modelos que serão obtidos usando-se técnicas de iden- 
tificação no presente livro serão estocásticos, apesar de normalmente, por 
facilidade, representar apenas a média do valor de saída do modelo. 


Exemplo 1.2.8. Um modelo estocástico simples 


Até este ponto, todos os modelos apresentados foram determinísticos. 
Isso é evidenciado pelo fato de que em nenhum desses modelos foi levado 
em conta qualquer tipo de incerteza. Isso é normalmente feito incluindo 
variáveis aleatórias nos modelos. Por exemplo, considere a última equação 
do modelo (1.5). Se apenas essa equação for analisada como um modelo 
em si, tal modelo seria classificado como não autônomo, monovariável (com 
entrada C e saída B) e determinístico. O modelo é determinístico pois todas 
as variáveis e parâmetros no modelo são determinísticas. 

Se o lado direito da última equação em (1.5) não explica exatamente 
o número de besouros observados duas semanas no futuro, haverá uma 
diferença entre o valor observado de besouros e o valor determinado usando- 
se a referida equação. Essa diferença reflete incertezas tanto nas medições 
quanto na própria forma da equação e é normalmente expressa usando- 
se uma variável aleatória. Portanto, adicionando e(k + 1) a essa equação 
obtém-se 


B(k+1)=C(A)L— nc] + B(B mo] +el+), (16) 


sendo que e(k) é uma variável aleatória qualquer. Portanto, a saída do 
modelo, B(k + 1), não é mais um único valor, mas é uma variável aleatória 
que, de acordo com sua distribuição de probabilidade, tem um intervalo de 
valores possíveis de ocorrer. O modelo (1.6) é estocástico. [nl] 


Modelos paramétricos e não-paramétricos. A distinção entre esses dois 
tipos de modelos não é totalmente universal. Na maioria dos casos, e neste | 
, 
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livro serão denominados paramétricos aqueles modelos que tiverem pa- 
râmetros, ou seja, números, coeficientes que os caracterizem. Por outro 
lado, modelos não-paramétricos serão representações gráficas (que não têm 
parâmetros), tais como a resposta ao impulso e a resposta em frequência. 
Esses conceitos e as principais diferenças entre modelos paramétricos e não- 
paramétricos serão discutidos em detalhe nos Capítulos 2, 3 e 4. 


Exemplo 1.2.9. Modelos paramétricos e não-paramétricos 


O modelo 


1 


Ho) = 570,71 


(17) 
é paramétrico, sendo que seus parâmetros são (1; 0,4; 1). A resposta ao 


impulso h(t) = L-!H(s)) do modelo (1.7) é mostrada na Figura 1.1, e a 
sua resposta em frequência H(jw) = F(h(t)) é mostrada na Figura 1.2. 


08 
06 


04, 


E, 
0) 
-2 
-04 
5 10 15 20 2s 30 
tempo 


FIGURA 1.1: Representações não-paramétricas. Resposta ao impulso 
Resposta ao impulso de (1.7). 
Essas figuras contêm a mesma informação que a Eq. 1.7, apesar de não 


ter nenhum parâmetro, uma vez que são representações gráficas. Portanto, 
os modelos das Figuras 1.1 e 1.2 são não-paramétricos. [a 


*Em algumas áreas, convenciona-se classificar de “não-paramétricos" modelos com 
parâmetros, mas nos quais tais parâmetros não têm interpretação fisica direta. 


Digitalizado com CamScanner 


1 MODELAGEM MATEMÁTICA 


a 
F 


1.2.3 Representações de modelos lineares 


Ha diversas representações matemáticas de modelos lineares. Uma das 
mais usadas é a função de transferência definida como a transformada da 
resposta ao impulso A(t) do sistema, para condições iniciais nulas. Se a 
resposta ao impulso for contínua no tempo, então a transformada usada 
é a de Laplace e a função de transferência é representada por H(s). A 
transformada de Laplace de um sinal x(t) é definida da seguinte maneira: 


X(s) = Llz(9) = / E alter ttdt, (1.8) 
0 


A transformada inversa de Laplace é definida como 
o+jt 


=) =LUx(9) = 5 À  xlsestds, (1.9) 


o-joo 


sendo s = 0 + jw. 


o 10º o 
vo (radis) 


Figura 1,2: Representações não-paramétricas, Resposta em freqiiência 


O gráfico superior mostra o módulo (ganho) da resposta em 
fregúência de (1.7), e o gráfico inferior, a fase. 
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Se a resposta ao impulso for discreta no tempo h(k), a respectiva função 
de transferência H(z) é por definição a transformada Z de h(k) para con- 
dições iniciais nulas. A transformada Z de uma segiiência z(k) é definida 
como 

k=0 


x() = Zle(6))= 5, c(bjot (1.10) 


k=-o0 


A transformada Z inversa é definida como 
z(k) = ZM X(2)) = = f Xtoatrias, (1.11) 


sendo que f representa a integral fechada, no sentido anti-horário, centrada 
na origem. 

Tanto H(s) quanto H(z) são normalmente representadas, respectiva- 
mente, como o quociente de dois polinômios em s e em z. Se em vez de 
tomar a transformada de Laplace de h(t) fosse tomada a transformada de 
Fourier obter-se-ia H(jw), a resposta em fregiiência do sistema. A trans- 
formada de Fourier de um sinal z(t) é definida como 


m 
q 
00 Ê a 
X(ju) = Fla(8) = / e(t)e ivtdr, 11) É 
—o0 
sendo j = 1. A transformada inversa de Fourier é definida como 5 
o ] 
elo) = FARO) ae ) X (just da, qu) os 
27 J=oo a 
H(jw) pode ser obtida diretamente a partir de H(s) substituindo-se s E 
por jw. Semelhantemente, no caso discreto, a transformada discreta de B 


Fourier de H(z), H(e/), pode ser obtida substituindo-se z por ei, 
Exemplo 1.2.10. Função de transferência 


O modelo (1.7) é uma função de transferência contínua. Em tempo 
discreto, as funções de transferência são representadas como o quociente 
de dois polinômios em z. Por exemplo, um modelo discreto equivalente à 
função de transferência contínua (1.7) é 


0,107522 + 0,21512 + 0,1075 


H = 
(2) = Co2— 1,6129z + 0,8280 


, (1.14) 


cuja resposta ao impulso é mostrada na Figura 1.3. [mn] 
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Uma outra representação muito usada é a representação no espaço de 
estados. Para o caso autônomo, contínuo no tempo, a representação no 
espaço de estados tem a seguinte forma geral x = f(x), sendo x E IR” 
o vetor de estado n-dimensional, e x = dx/dt. O caso não autônomo é 
representado como 


X= fxu(t)), (1.15) 


sendo que u(t) € IR” é o vetor de entradas formado por r funções temporais. 


“o 8 10 15 20 25 30 
tempo 
FIGURA 1.3: Resposta ao impulso de um modelo discreto 


Resposta ao impulso de (1.14). O modelo discreto produz apenas 
os valores indicados com “o'. A linha contínua foi adicionada para 
facilitar a compreensão. 


Assumindo que o sistema é linear e acrescentando uma equação estática 
que descreva o processo de medição, chega-se à conhecida representação no 
espaço de estados tão usada na teoria de sistemas lineares 


= Ax+Bu 
y = Cx+Du, (1.16) 


sendo y E IRP o vetor p-dimensional de saídas medidas, e 4, B, Ce D são 
matrizes constantes. E para o caso discreto 


x(k + 1) 
y(k) 


dx(k) + Pu(k) 
Cax(k) + Dau(k). (1.17) 
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B possível passar da representação de função de transferência para a de 
espaço de estados e vice-versa com facilidade (ver Exercício 1.6), bem como 
é possível passar de modelos contínuos para discretos e vice-versa. 


Exemplo 1.2.11. Modelos em espaço de estados 


Os modelos (1.4) e (1.5) podem ser representados no espaço de estados 
respectivamente como 


| L(k+1) 0 0 v L(k) 
C(k+1) | = | I-m 0 0 | E: + (1.18) 
B(k+1) O 1-u 1-w B(k) 


L(k+1) 0 0 v L(k) 
E a [7 a EMIR 
B(k+1) O 1-u 1-u B(k) 


0 
+ | =L(k)a | A(k). (1.19) 
0 


Os modelos acima correspondem à versão discreta da equação dinâmica 
em (1.16), com pequenas diferenças. No caso do modelo (1.18), não há 
entrada e a matriz & é constante, indicando que tal modelo é linear. Já no 
caso do modelo (1.19), a matriz I' não é constante, pois depende do estado 
L(k), e consegiientemente é não-linear. [n| 


Uma representação muito útil em identificação de sistemas é o modelo 
auto-regressivo (AR) 


v(k) = ay(k— 1) +aoy(k — 2) +... + an,ylk — ny). (1.20) 


Como pode ser visto, a última equação é autônoma. Incluindo-se uma 
entrada, tem-se um modelo auto-regressivo com entrada ezógena (ARX) 


Wk)=ay(k=1) +... +an,y(k — ny) + bru(k — 1) +... + Daçu(k — nu). 
(1.21) 
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Exemplo 1.2.12, Modelo ARX de conversor buck 


Um modelo ARX de um conversor estático CC-CC do tipo buck é 


v(k) = 1,7649y(k — 1) — 0,8027y(k — 2) + 0,86G1u(k — 3) 
—0,73578u(k — 1) + 0,07513u(k — 2) + E(k), (1.22) 


sendo que tanto y(k) quanto u(k) são dados em volts. A tensão na saída 
do conversor é y(k), u(k) é a tensão contínua usada para definir a razão 
cíclica do conversor e E(k) é o erro cometido pelo modelo ao tentar explicar 
y(k). As características de E(k) são muito importantes em identificação de 
sistemas e serão foco de atenção nos Capítulos 5, 6 e 7. Como conseqiiência 
do sistema ser não-linear e o modelo linear, este é “válido” para valores da 
entrada restritos à faixa 2,2 < u(k) < 2,5. A simulação do modelo (1.22) 
será ilustrada no Exemplo 1.6.2. [m] 


Finalmente, o modelo auto-regressivo com média móvel e entrada exó- 
gena (ARMAX) é representado como se segue: 


ulk) = ay(k-1)+...+anylk-—ny) +byu(k — 1) +... 
+bruu(k—nu)+ crE(k—1)+.. Hen E(k—ne) +E(K), (1.23) 


sendo que ny, Ny e ng são inteiros e É é denominado resíduo e a justificativa 
para incluir os respectivos termos no modelo será discutida no Capítulo 7. 
O resíduo £ é uma variável aleatória, o que torna o modelo (1.23) esto- 
cástico. Na prática, obtêm-se modelos AR e ARX também com o termo 
de resíduo E(k), que foi omitido nas Eqs. 1.20)-(1.22) para simplificar. Va- 
le a pena notar que as representações AR e ARX são casos particulares 
da representação ARMAX, que, por sua vez, é um caso particular de uma 
representação mais geral. As relações entre essas representações serão apre- 
sentadas na Seção 2.6. A representação ARMAX será vista com detalhes 
ao longo do livro. Uma breve apresentação de representações não-lineares 
será feita no Capítulo 10, 


1.3 Estimação de Parâmetros | 


O assunto de estimação de parâmetros será visto em detalhes em seções 
futuras. Neste ponto, entretanto, é importante entender qual é o objetivo 


SAGUIRRE et al., 2000. 
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da estimação de parâmetros e perceber as semelhanças e diferenças com 
relação ao problema de identificação de sistemas, 

Para motivar esta discussão preliminar do problema, suponha que es- 
tejam disponíveis medições de duas grandezas x e y. Tais variáveis estão 
relacionadas da seguinte forma y = f(x). Uma situação comum ocorre 
quando a função f(:) é caracterizada por um vetor de parâmetros 0. Nesse 
caso diz-se que f(:) é parametrizada por 0 e tal relação pode ser explicita- 
mente representada escrevendo-se y = f(x,9). O problema de estimação de 
parâmetros consiste em estimar Q a partir de um conjunto de medidas de 
ey, ou seja, a partir de (Z1,22,... ,ZN) e (yiy2, e UN). 


Exemplo 1.3.1. Estimação de parâmetros de uma reta 


Neste exemplo usaremos dados de um potenciômetro real que são mos- 
trados na Figura 1.4 com cruzes. No presente caso, o eixo das abcissas 
corresponde à posição angular do cursor do potenciômetro, enquanto o eixo 
das ordenadas corresponde à tensão de saída em volts, dividida pela tensão 
de alimentação, também em volts. 


E o2 
| 015 
8 
zo 
Ê 
E! 0,05 
0 
Meg so 100 150 200 250 300 
graus angulares 


FIGURA 1.4: Reta estimada 


Os dados medidos são marcados com (x), e a reta ajustada usando 
regressão linear, com (-). Esta reta é parametrizada pelo vetor 
de parâmetros [91 92]”, em que 6, é o valor de y quando x = 0 e 
8» é a inclinação da reta. Os valores desses parâmetros estimados 
diretamente dos dados são 0, = —1,55 x 103 e 8, = 6,98 x 1074, 


Observando-se essa figura chega-se à conclusão que a função f(-) pode 


ser bem aproximada por uma reta. Assim, chamamos de f(:) a função 
estimada, que neste caso é a reta y = 01 + 0,7. 


Digitalizado com CamScanner 


6s 1 MODELAGEM MATEMÁTICA 


Usando técnicas conhecidas de regressão linear, algumas das quais serão 
apresentadas no Capítulo 5, obtêm-se 01 = —1,55 x 10"? e Ô, = 6,98x 1071. 
(m] 


O exemplo mencionado acima, apesar de simples, é útil para levantar 
uma série de questões envolvidas na estimação de parâmetros, conforme 
listado a seguir: 


1. a estimação de parâmetros é uma etapa que sucede a escolha da função 
f('). No exemplo acima, primeiramente definiu-se que f(:) seria a reta 
y = 61 + 0h, e só depois procedeu-se à estimação dos parâmetros 01 
e O; 


2. a escolha de uma aproximação de f(:) foi grandemente facilitada pelo 
fato de se tratar de uma função estática bastante simples. Em outros 
problemas f(:) poderia ser bem mais complicada e a escolha de f(-) 
certamente não seria óbvia; 


3. o uso de técnicas de regressão linear para estimar [91 02)” foi possível 
graças ao fato de se ter escolhido uma função f(:) que é linear nos 
parâmetros 04 e 02, uma vez que tal função pode ser decomposta da 
seguinte forma y = [1 x)[9, 05]. Isso nem sempre será o caso na 
prática; 


4. os parâmetros acima foram estimados de uma só vez, a partir de 
um conjunto de medidas. Isso é chamado de estimação em batela- 
da. No caso dos parâmetros mudarem com o tempo, é possível ter-se 
uma estimativa atualizada de 6, Ô(t), se medições (z;,y;) forem feitas 
periodicamente e usadas para atualizar o valor estimado do vetor de 
parâmetros. Isso é conhecido como estimação recursiva de parâmetros, 
sendo que algumas técnicas serão vistas no Capítulo 8. 


Exemplo 1.3.2. Cálculo dos parâmetros de uma reta 


Neste exemplo vamos considerar a situação em que apenas dois pontos 
serão utilizados para estimar os parâmetros de uma reta. Isso é possível, 
uma vez que a equação de uma reta tem apenas dois parâmetros, e o uso de 
dois pontos resultará num sistema de duas equações com duas incógnitas 
da forma 


01 +10, 
01 + 2900. 


un 
y2z 
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Tomando os pontos (21,41) = (144);0/98) e (22572) = (15840109) do 
conjunto de medidas, tem-se o seguinte sistema de equações: 


0,098] [1 1440][A 
Lo | eg LA y Klaaa) 


Para determinar os parâmetros da reta será necessário inverter a matriz da 
equação acima. Portanto, 


8 ).| 11,00 —10,00 ] f 0,098 ]  f —1,200 x 10-2 (125) 
9 | | -0,069 0,069 0,109 7,639 x 1054 |" Mó 


A reta resultante é mostrada na Figura 1.5. Nota-se que, apesar de 
utilizar apenas dois pontos, o ajuste aos dados ainda é aceitável. O uso de 
apenas dois pontos para determinar a reta não será apropriado na prática 
quando o nível de ruído (incerteza) nos dados for significativo. Quando for 
essa a situação, é intuitivo usar mais pontos para estimar os parâmetros, mas 
nesse caso a matriz resultante não é mais quadrada. Métodos de regressão 
linear objetivam contornar esse problema e serão descritos no Capítulo 5. 

õ 


Em muitos problemas práticos de estimação de parâmetros, a função 
F(:) será uma equação dinâmica, ao invés de uma equação estática, como 
no exemplo acima. Uma das consegiiências disso é que a escolha de tal 
função não será necessariamente simples e nem sempre a forma de f() 
se tornará evidente observando-se um gráfico. Em diversos problemas, tal 
função é obtida a partir do desenvolvimento das equações que descrevem a * 
física do sistema, um exemplo disso será visto na próxima seção. 

Em problemas de identificação de sistemas, não apenas o vetor O deve 
ser estimado como também a função f(:) precisa ser determinada. Grossei- 
ramente falando, pode-se dizer que a estimação de parâmetros é apenas uma 
das etapas (normalmente a mais simples) de um problema de identificação 
de sistemas. Uma diferença importante, entretanto, é que em muitos pro- 
blemas de identificação de sistemas, ao contrário do problema de estimação, 
os parâmetros normalmente não têm nenhum significado físico. 

O que determinará se os parâmetros da função f(:) representam pará- 
metros físicos do sistema é a escolha de f(:). Se tal função for determinada 
apenas como uma estrutura matemática apta para descrever uma relação 
de causa e efeito, os parâmetros normalmente não terão significado físico e o 
modelo resultante é chamado de um modelo tipo caixa preta. Ao contrário, 
se f(:) for derivada a partir das equações que descrevem o comportamento 
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do processo (por exemplo, equações de conservação de massa, equações 
de Kirchhoff etc.), os parâmetros normalmente terão um significado físico 
bastante claro (são, por exemplo, massas, coeficientes de troca de calor, re- 
sistências elétricas etc.) Um exemplo de modelo derivado a partir da física 
do processo é apresentado na próxima seção. Como será visto, a equação 
de Bernoulli terá um papel importante na derivação de tal modelo. 


tensão de saída por volt de alimentação (VV) 


o E] 100 150 200 250 E) 
graus anquiares 


FIGURA 1.5: Reta com parâmetros calculados 


Dados medidos são marcados com cruzes, e a reta y = —1,200 x 
1072 + 7,639 x 10-1z, com traço. 


1.4 Modelagem pela Física: um Estudo de Caso 


Nesta seção será desenvolvido um modelo para um sistema real de bombe- 
amento de água, que é ilustrado esquematicamente na Figura 1.6. Trata-se 
de um tanque com capacidade aproximada de 2.500 litros que é aberto e no 
qual a água bombeada entra à altura da sua base. Também nessa altura 
encontra-se o duto de saída que possui um tubo Venturi, a partir do qual 
pode-se medir a vazão de água que deixa o tanque. Essa água é jogada em 
um reservatório de onde é bombeada novamente para o tanque. O conjunto 
moto-bomba é acionado por um inversor de fregiiência. A frequência de 
saída do inversor determina a velocidade do motor e é variada a partir de 
um sinal de comando em corrente de 4 a 20mA. Na saída da bomba há 
uma placa de orifício, com as respectivas tomadas de pressão, que podem 
ser utilizadas tanto para medição da pressão na saída da bomba quanto 
para medição da vazão de entrada no tanque. 

Pela descrição acima, percebe-se que o sinal de comando do inversor 
influencia a vazão de saída. Deseja-se desenvolver um modelo para esse 
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sistema que permita determinar a vazão de saída a partir do sinal de 4 a 
20mA na entrada do inversor. 


Pam 


Inversor de 
frequência 


Controlador 


u(t) 4a20mA 


Referência 
de 4, ou 
deh 


FIGURA 1.6: Esquema de planta piloto de bombeamento 
Em aplicações de controle de vazão de saída, qo, ou de nível do 


tanque, h, um modelo do processo relacionaria o sinal de atuação 
(entrada) u(t) a uma dessas variáveis. 


A fim de facilitar a modelagem serão feitas as seguintes considerações 
simplificadoras: 


1. o sistema será considerado a parâmetros concentrados. Assim sen- 
do, só será de interesse conhecer algumas variáveis em alguns pontos 
específicos e não, por exemplo, ao longo de um duto; 

2. a perda de carga nos dutos será desprezada; 

3. a área do tanque é constante. Observando-se o interior do tanque, 
percebe-se que esta consideração é, a rigor, incorreta. Entretanto, 
após um certo nível, a área transversal do tanque é de fato constante; 

4. a dinâmica do inversor e do conjunto moto-bomba é muito mais rápida 
do que a dinâmica do tanque e, portanto, pode ser desprezada. Assim, 


o inversor e o conjunto moto-bomba serão modelados como um sistema 
estático; 
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5. a água é incompressível e seu peso específico não varia; 


6. a pressão atmosférica em cada ponto da planta piloto é a mesma, 


1.4.1 A equação diferencial 


O ponto de partida na modelagem deste sistema é escrever a equação que 
governa o balanço de massa no tanque. Tal balanço estabelece que a vazão 
(mássica) de água que entra menos a que sai é igual à variação de massa de 
água no tanque. Matematicamente, tem-se 


ca = Wi — Wo, (1.26) 
sendo que m é a massa de água no tanque, em kg; w; € wo são as vazões 
mássicas de entrada e saída, respectivamente, em kg/s. A Eq.1.26 é uma 
equação diferencial de primeira ordem que envolve a vazão mássica da saída 
two, uma variável de interesse no problema. 

A fim de obter um modelo que relacione a vazão de saída com o sinal 
de comando do inversor, será necessário relacionar tal sinal com a vazão de 
entrada w;. Antes, porém, será útil converter vazões mássicas em vazões 
volumétricas. Para isso, basta lembrar que a massa de água no tanque 
é igual ao volume vezes a massa específica de água, ou seja, m = Vp. 
Considerando-se a área do tanque constante e igual a Am?, pode-se escrever 


m= Ahp, (1.27) 
sendo que p é a massa específica da água em kg/m; h é a altura do nível 


de água em metros e A é a área em mê. Substituindo a tiltima equação 
em (1.26), tem-se 


dh 
PA = MP-G%p 
dh de fmçs 
E quam) 


sendo que q; € qo são, respectivamente, as vazões volumétricas de entrada e 
saída, em m?/s. 

A Eq. 1.28 é uma equação diferencial cuja variável de estado é a altura 
do nível de água no tanque, h, e depende das vazões de entrada e saída 
de água, bem como das dimensões do tanque. Nessa equação aparece o 
primeiro parâmetro no modelo, a saber, a área, À, que pode ser determinada 
a partir da geometria e dimensões do tanque. 
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1.4.2 Relações algébricas 


A fim de obter um modelo que relacione o sinal de comando do inversor 
com a vazão de saída, será necessário dar alguns passos a mais, uma vez 
que a Eq. 1.28 não inclui explicitamente o sinal de comando. É bem verdade 
que a vazão de entrada q; deve estar relacionada com o sinal de comando 
do inversor, mas tal relação precisa ser determinada para ser incluída no 
modelo. 

Para detalhar a Eq. 1.28, será utilizada a lei de Bernoulli que estabelece 
que a vazão em um determinado trecho de um circuito hidráulico é propor- 
cional à raiz quadrada da diferença de pressão entre as extremidades de tal 
trecho. Ou seja, 


q=kvAP, (1.29) 


sendo que AP é a diferença de pressão entre as extremidades do circuito hi- 
dráulico considerado e k é uma constante de proporcionalidade relacionada 
à resistência hidráulica do trecho em questão. 

Aplicando-se a Eq. 1.29 à tubulação de saída, tem-se 


Go = kovP — Pam, (1.30) 


sendo que P é a pressão na base do tanque, Pam é a pressão atmosférica 
em kgf/cm? e ko é a constante hidráulica do duto de deságiie do tanque. 

De forma análoga, aplicando a lei de Bernoulli ao duto de recalque, que 
liga a bomba d'água ao tanque, tem-se 


ga=kvP-P, (1.31) 


sendo que Ph é a pressão na saída da bomba em kgf/cm? e k; é a constante 
hidráulica do duto de recalque. 

A pressão P, por sua vez, pode ser determinada a partir da pressão 
atmosférica e da coluna d'água no tanque, ou seja, 


P= yh+ Pam, (1.32) 


sendo que y é o peso específico da água em kgf/m?. Por fim, substituindo 
as Egs. 1,30-1.32 em (1.28), chega-se a 


dh a kB — qh — Pam — kovyh 
FR” (1.33) 


Apesar de mais detalhada, a última equação é equivalente à Eq. 1.28. 
Em (1.33) ainda não aparece o sinal de comando do inversor, mas aparece 
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a pressão Py na saída da bomba, que certamente é determinada pelo sinal 
de comando. 

Deve ser notado que (1.33) está na forma de uma equação de estado, 
ou seja, é = f(x,u), sendo que a variável de estado é o nível, h; Pp é uma 
variável de entrada; e os demais elementos da equação são parâmetros a de- 
terminar. Desses parâmetros, A, Pam € y podem ser determinados a partir 
da geometria do tanque, da localização do mesmo e das propriedades da 
água. De fato, os valores aproximados desses parâmetros são: A = 2,5m?, 
Pam = 10.300 kgf/m2 e y = 1000kgf/m?. Por outro lado, os parâmetros k; 
e ko ainda precisam ser determinados. 

Antes de se passar à fase de determinação dos parâmetros do modelo 
(1.33), deseja-se expressar a pressão Pb em termos do sinal de comando do 
inversor, que é um sinal em corrente de 4 a 20mA. Ou seja, chamando o 
sinal de comando de u(t), deseja-se escrever Pp = g(u). 

Seria muito difícil tentar descrever a função g(:) a partir de equações 
que descrevem a física envolvida no funcionamento do inversor e do con- 
junto moto-bomba. A fim de simplificar o problema, será considerado que 
a relação g(:) é estática, ou seja, variações em u(t) produzem variações 
instantâneas em P, (ver Consideração 4 na p. 71). 

O inversor e o conjunto moto-bomba são incapazes de reagir instanta- 
neamente ao comando u(t). Entretanto, como sua velocidade de resposta é 
muito mais rápida do que a dinâmica associada ao nível de água no tanque, 
do ponto de vista do tanque, pode-se realisticamente supor que o inversor e 
o conjunto moto-bomba respondem instantaneamente. A seguir serão cole- 
tados diversos valores dessas variáveis e será verificado se há alguma relação 
simples entre elas. 

A Figura 1.7 mostra valores coletados em testes estáticos durante os 
quais aplicou-se um sinal constante de corrente na entrada do inversor e 
esperou-se um tempo suficientemente longo para que a pressão na saída da 
bomba estabilizasse. Subsegiientemente, foram medidas tanto a variável de 
entrada (o sinal de corrente) quanto a de saída (a pressão imposta pela 
bomba). 

A Figura 1.7 sugere que existe uma relação simples e bem definida en- 
tre u(t) e P, na faiza de operação considerada durante o teste. Portanto, 
utilizando-se técnicas de regressão linear para ajustar uma reta aos dados, 
obtém-se 


P, = 35549 + 6828 u(t), (1.34) 


sendo que u(t) é o sinal de comando do inversor em mA. 

Até o presente, foi considerado que o nível, h, do tanque corresponde 
à altura medida do seu fundo até o nível de água. Mas, na realidade, a 
saída de água do tanque está localizada a 0,114m do fundo. Portanto, 
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é conveniente que esse seja o nível zero. Isso equivale a subtrair 0,114m 
de todas as medições de nível. Entretanto, para que esta cota passe, de 
fato, a ser a referência de nível zero, é necessário garantir que, como na 
planta, o modelo mostre vazão nula quando o nível for zero. Para isso será 
necessário determinar um valor constante, K, que adicionado ao modelo 
resultará em vazão nula, e consegiientemente dh/dt = 0, para o caso de 
nível zero. Portanto, fazendo-se h = O em (1.33), tem-se 


x10! 


155 16 ” 175 


165 
(ma) 


FIGURA 1.7: Relação entre comando do inversor e pressão em planta piloto 


Relação entre sinal de comando do inversor e pressão na saída 
da bomba. Os dados medidos são marcados com (x), e a reta 
ajustada usando regressão linear, com (-). 


Sh. ki/P$ — Pam 


Er rá 
kiy/P5 = Pam 
DE ni, ii (1.35) 


sendo que Pj é a pressão observada na saída da bomba quando o nível 
(na nova cota) é zero. O valor medido para essa variável foi Pj=14.213,4 
kgf/m?. 


1.4.3 Determinação de parâmetros 


Nesta seção serão determinados os parâmetros ko e k; do modelo (1.33). 
Para isso, é necessário lembrar de que tais parâmetros surgem da aplicação 
da lei de Bernoulli aos dutos de entrada e saída do tanque, Eqs.1.30 e 
1.31, respectivamente. Essas equações revelam que os parâmetros a serem 
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determinados podem ser obtidos a partir dos gráficos de qox VP-—Pyum € 
qxvP=P. Para se obter os dados necessários para traçar tais gráficos, 
manteve-se o sinal de comando do inversor constante e esperou-se o sistema 
de bombeamento estabilizar. Esse estado é chamado de regime permanente 
ou estado estacionário. Isso ocorre quando a vazão de entrada é igual à 
vazão de saída e o nível permanece constante, ou seja, dh/dt = 0. Após 
atingir o regime permanente, foram medidas todas as variáveis necessárias 
e traçaram-se os respectivos gráficos. 

Para o duto de entrada obteve-se o gráfico da Figura 1.8, e, usando-se 
técnicas de regressão linear, obteve-se 


q ==1,87 x 102 45,60 x 104/P; — 7h — Pam, (1.36) 
portanto k = 9q/0Pb = yh = Pam = 5,60 x 10-4m' /s(kgf)!/2, 


002 


die 4 és 8 6 70 7 


s e 
(iglmeros 
FIGURA 1.8: Estimação de parâmetros no duto de recalque 


Os dados medidos são marcados com (x), e a reta ajustada usando 
regressão linear, com (=). O eixo das abcissas é (Pb—7h— Pum)!/2. 
A inclinação da reta ajustada é uma estimativa de ki. 


Procedendo-se de forma análoga para o duto de deságiie, obteve-se o 
gráfico da Figura 1.9. Neste caso, o uso de regressão linear resultou na 
seguinte expressão: 


qo = 1,59 x 1072 + 3,06 x 105 /9yh + 6,26 x 10-8yh, (1.37) 


logo, ko = 9q0/07A = 3,06 x 105 + 1,25 x 10-5,/7h m! /s(kgf)!/2. Vale 
a pena notar que (1.37) é um polinômio de segundo grau em Vyh. 

Como anteriormente visto, os dados nesse caso também poderiam ter 
sido ajustados por uma reta. Entretanto, julgou-se que um polinômio de 
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segundo grau seria mais adequado. Assim, finalmente, os parâmetros do 
modelo (1.33) são: A = 2,5m2, Pum = 10.300kgf/m2, 7 = 1000 kgf/m?, 

kh = 5,60x 10-!m!/s(kgt)!/2 e ko = 3,06x 10-5+1,25 x 1078 9h m! /s(kgt)!/2, K = 
=1,40 x 10-2m/s (ver Eq. 1.35). 


” 2 


º 5 10 15 
(ngumapo,s 


FIGURA 1.9: Estimação de parâmetros no duto de deságiie 


Os dados medidos são marcados com (x), e a reta ajustada usan- 
do regressão linear, com (-). O eixo das abcissas é (yh)!/2, A 
derivada da função ajustada é uma estimativa de ko. 


O modelo pode agora ser simulado para um determinado sinal de co- 
mando u(t). Substituindo-se os parâmetros acima e a Eq. 1.34 no modelo 
(1.33), após somar K, obtém-se 


dh 5,60 x 10-4,/35549 +682Bu(E) — 1000h — 10300 


de A 
“ (3,06x1075+1,25x10-5 1000h) /1000h 
A 


-0,014. (1.38) 


O modelo (1.38) pode ser simulado usando-se os seguintes arquivos: 
eq. bomb, sim bomb, ens. 25 e ens 26 O. 


1.4.4 Sintonia 


A equação diferencial (1.38) é um modelo do processo de bombeamento 
de água. A fim de verificar o desempenho de tal modelo, é necessário 
codificá-lo e simulá-lo em uma condição de operação da qual se tenha medi- 
ções. Durante os testes realizados o nível h(t) foi medido. No que se segue, 
essa medição será comparada com a saída do modelo obtida pela integração 
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numérica de (1.38). Vale a pena notar que a relação entre o nível e a vazão 
de saída é dada pela equação algébrica (1.97). 

A Figura 1.10 mostra o nível do processo para uma variação em degrau 
de 16,34mA a 17,05mA, na corrente de comando do inversor. 


04 
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FIGURA 1.10: Nível medido e simulado com modelo não sintonizado 


Resposta do nível a uma variação em degrau do sinal de entrada 
u(t). Dados medidos (ens.25 O) são indicados por (Je 
(=) representam os dados obtidos usando-se o modelo (1.38). Os 
picos são devidos ao ruído induzido no processo de medição. 


Nessa figura, o sinal medido é mostrado com traço pontilhado, ao passo 
que o nível calculado pelo modelo (1.38) é mostrado com linha contínua. 
Observa-se que a resposta do modelo tem a mesma forma da resposta do | 
processo, porém precisa de ajustes. Isso indica que a ordem do modelo é | 
uma boa aproximação à ordem da planta. Note-se que, apesar da ordem da 
planta ser elevada, um modelo de primeira ordem descreve satisfatoriamente 
a dinâmica dominante da mesma. Estudos revelam que grande parte de 
processos industriais podem ser aproximados por modelos de primeira e 
segunda ordem, com e sem atraso puro de tempo. | 
De forma geral, percebe-se que a resposta do modelo é mais rápida do 
que a do processo e, também, o ganho do modelo é menor do que o ganho do 
processo. Portanto, para sintonizar o modelo será desejável aumentar sua 
constante de tempo e aumentar seu ganho, conforme detalhado a seguir. 


1. Ajuste da constante de tempo. Aumentar a constante de tempo cor- 
responde a tornar a resposta do modelo mais lenta, ou seja, a diminuir | 
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a velocidade com que o nível varia no tempo. Após realizar algumas 
simulações, chegou-se ao seguinte ajuste: lnsintontzado = 0,4 h. 


2. Ajuste do ganho. A Figura 1.10 mostra que o ganho do modelo precisa 
ser aumentado. Em outras palavras, o valor final de nível precisa ser 
aumentado para o caso simulado. Isso equivale a fazer o modelo “en 
xergar” um degrau de entrada de amplitude maior. Como para o caso 
da constante de tempo, após algumas simulações, chegou-se ao seguin- 
te ajuste: aumentar a amplitude do degrau de entrada de 16,34mA a 
17,05mA, visto pelo modelo, para 16,34mA a 1,012x17,05mA. 


1.4.5 Validação 


A Figura 1.11 deixa claro que os ajustes descritos na última seção foram 
eficazes em ajustar a saída do modelo aos dados medidos na planta. Mas 
quão gerais são esses ajustes? Será que são válidos apenas para a situação 
mostrada nessa figura? 


04, 


0,35, 


0,05] 
o é fem 
º 500 1000 1500 


tempo (s) 
FIGURA 1.11: Nível medido e simulado com modelo sintonizado 


Resposta do nível a uma variação em degrau do sinal de entra- 
da u(t). Dados medidos (ens.25 O) são indicados por (- -) e 
(=) representam os dados obtidos usando-se o modelo sintonizado 
(com ajustes), 


Para responder a essas perguntas é necessário validar o modelo. Para 
isso, deve-se simular o modelo sem qualquer ajuste adicional e compará-lo 
a dados medidos coletados em testes diferentes daqueles usados no desen- 
volvimento e sintonia do modelo. No presente exemplo, um outro teste 
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dinâmico foi efetuado aplicando-se um degrau negativo de corrente, ou seja, 
diminuiu-se o comando do inversor e isso acarretou a diminuição de água 
sendo bombeada para o tanque. 


a se 


o 500 1000 1500 
tempo (s) 


FIGURA 1.12: Sinal de nível para validação do modelo sintonizado 


Resposta do nível a uma variação em degrau do sinal de entrada 
u(t) diferente daquela usada para sintonizar o modelo. Dados 
medidos (ens.. 26 (0) são indicados por (- -), e (-) representam os 
dados obtidos usando-se o modelo sintonizado anteriormente. 


A Figura 1.12 mostra os resultados do novo teste, bem como a simulação 
do modelo nessa nova condição. A figura sugere que o modelo tem a capa- 
cidade de representar bem o comportamento temporal do processo. 


1.5 Identificação de Sistemas 


No exemplo desenvolvido na seção anterior foi fundamental o conhecimento 
de algumas características do sistema. Isso permitiu escrever o balanço de 
massa para o tanque principal, bem como aplicar a lei de Bernoulli aos dutos 
de recalque e de deságiie. Infelizmente, em poucas situações práticas haverá 
tempo e conhecimento suficientes para desenvolver um modelo a partir das 
equações que regem a física do processo. Nesses casos, seria totalmente 
inviável desenvolver um modelo baseado nas leis que regem os fenômenos 
do sistema real, conforme foi feito na Seção 1.4. 

Identificação de sistemas é um procedimento alternativo. A motivação 
básica é simples. Suponha que estejam disponíveis os sinais de entrada, 
u(k), e de saída, y(k), de um sistema real qualquer. A identificação de 
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sistemas se propõe a obter um modelo matemático que explique, pelo me- 
nos em parte e de forma aproximada, a relação de causa e efeito presente 
nos dados. Ou seja, tenta-se responder à pergunta: que modelo há que, ao 
ser excitado por u(k), resulta em y(k)? Obviamente, a pergunta acima é 
muito geral e na prática restringe-se a busca de modelos a famílias relati- 
vamente pequenas. Por exemplo, pode-se buscar um modelo ARX de até 
quarta ordem que melhor represente a dinâmica presente nos dados. Como 
consegiiência dessa restrição, corre-se o risco de que a família de modelos 
usada na busca não seja a mais adequada. 

Como será discutido ao longo do livro, há vários aspectos importantes 
envolvidos em problemas reais de identificação. Em linhas gerais, entretan- 
to, as principais etapas de um problema de identificação são: 


1. testes dinâmicos e coleta de dados. Uma vez que a identificação se pro- 
põe a obter modelos a partir de dados, é necessário gerar tais dados. 
Muitas vezes, os únicos dados disponíveis serão dados de “operação 
normal”. Em outras situações, entretanto, será possível e desejável 
efetuar testes de forma a extrair informação dinâmica do sistema. Pro- 
blemas importantes relacionados a esta etapa são a escolha dos sinais 
de excitação, a execução do teste e a escolha do tempo de amostragem. 
Essas e outras questões serão discutidas no Capítulo 12; 


2. escolha da representação matemática a ser usada. Na Seção 1.2.3 di- 
versas representações de modelos lineares foram brevemente revistas. 
Dentre elas, funções de transferência em tempo contínuo serão usadas 
em problemas de identificação determinística, conforme será visto no 
Capítulo 3. Por outro lado, boa parte do presente livro estará de- 
dicada à representação ARMAX, que é frequentemente utilizada em 
identificação estocástica; 


3. determinação da estrutura do modelo. No caso de modelos lineares, 
a escolha da sua estrutura se restringe, basicamente, à escolha do 
número de pólos e de zeros, bem como à determinação do atraso puro 
de tempo. Algumas técnicas para auxiliar nessa escolha serão descritas 
no Capítulo 12, para o caso de sistemas lineares e no Capítulo 11 para 
o caso de modelos não-lineares; 


4. estimação de parâmetros. Essa etapa começa com a escolha do al- 
goritmo a ser utilizado. No presente livro, serão estudados alguns 
algoritmos, mas diversos deles são variantes do método clássico de 
mínimos quadrados, a ser estudado no Capítulo 5. Esse método e su- 
as variantes podem ser usados desde que a representação escolhida no 
item 2 seja linear nos parâmetros. Métodos numéricos para resolver o 
problema de estimação de parâmetros serão discutidos no Anexo B; 
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5. validação do modelo, Tendo obtido uma família de modelos, é necessá- 
rio verificar se eles incorporam ou não as características de interesse do 
sistema original. Além disso, é interessante poder comparar os mode- 
los entre si e decidir se há algum candidato significativamente melhor 
que os demais. Essa etapa é certamente muito subjetiva, sendo que 
o resultado da validação dependerá fortemente da aplicação pretendi- 
da para o modelo e da quantidade de informação disponível sobre o 
sistema original, No Capítulo 13 apresentam-se algumas ferramentas 
úteis na validação de modelos. 


(a) 


28 

25 

e24 ] 

Em | 

22 1 

21 

O 20 400 60 0 1000 1200 1400 1600 1800 2000 
(o) 

18 1 11 11 

16 É 

e 

gu ] 

2 

1 

O 20 40 60 60 100 1200 1400 1600 1800 2000 
amostras 


FIGURA 1.13: Dados de entrada e saída de um conversor buck 


Dados de entrada e saída usados na identificação do modelo (1.22). 
(a) sinal de entrada, tensão que define a razão cíclica do conver- 
sor, e (b) sinal de saída, tensão elétrica na saída do conversor 
(acg7000 O), 


Exemplo 1.5.1, Dados de identificação 


O Exemplo 1.2.12 mostrou um modelo ARX obtido para um conversor 
estático CC-CC do tipo buck. Esse conversor é composto de diversos circui- 
tos e componentes eletrônicos. A modelagem pela física do processo nesse 
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caso consistiria em aplicar as leis de Kirchhoff e outras relações para des- 
crever tais circuitos e componentes. Apesar de possível, tal procedimento 
poderia exigir mais tempo e conhecimento do que o disponível. 
Entretanto, o modelo (1.22) foi obtido por técnicas de identificação a 
partir do conjunto de dados mostrado na Figura 1.13. Esse sistema será 
estudado em mais detalhes na Seção 16.4. Ao longo do livro serão apresen- 
tados procedimentos e algoritmos que permitem fazer isso. [n| 


1.6 Simulação de Modelos 


Uma vez obtido um modelo matemático, é necessário verificar se o compor- 
tamento de tal modelo equivale ao do sistema real e quais são os limites de 
validade. A Seção 1.4.5 descreve esse procedimento para o modelo derivado 
na Seção 1.4. A fim de avaliar o desempenho de um modelo, é necessário 
simulá-lo, ou seja, é necessário resolver as equações que compõem o mode- 
lo. Portanto, a forma de simular um modelo vai depender da representação 
utilizada. Os casos contínuo e discreto serão brevemente descritos a seguir. 


1.6.1 Modelos contínuos 


A simulação de modelos contínuos normalmente envolve a resolução de equa- 
ções diferenciais do tipo % = f(zst). Na maioria dos casos, obter uma 
solução analiticamente é impossível e, portanto, resolve-se a equação dife- 
rencial, de forma aproximada, por métodos numéricos. 

Seja a aproximação explícita de Euler 


Ea) po te de (E) a E() (1.39) 


e a aproximação implícita de Euler 

a(k) —- a(k — 1) 
T , 

sendo que T é o intervalo de integração. As Eqs.1.39 e 1.40 resultam, 

respectivamente, nas seguintes fórmulas de integração numérica: 


(tu) = (1.40) 


a(b) =2(k = 1) +TY(a(b = 1a)» 
a(b) = (6 = 1) + f ((6) ta) 


A última equação é chamada de implícita pois z(k) depende de si mesma, 
e a solução requer cálculos adicionais para determinar tal variável. 
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Exemplo 1.6.1, Simulação usando a fórmula de Euler 


Seja a equação diferencial à = =62:+5e”!, Para T = 0,3, a aproximação 
explícita de Euler resulta em 


2) = 2(k=1)+0,3 (=6x(k — 1) + 5e-H-1), 


Para resolver a equação diferencial + = —6z + 5e”! usando a equação 
acima, basta escolher uma condição inicial z(0) e resolver tal equação para 
k=1,2,... , [m| 


Um dos algoritmos de integração numérica mais utilizados na simulação 
de modelos contínuos é o algoritmo de Runge-Kutta de quarta ordem. Tal 
algoritmo é do tipo explícito e usa informação em pontos intermediários 
para determinar o estado do sistema. O algoritmo pode ser escrito como: 


Flz(k — 1), tk-1) 
f (at DATA t+ 5) 


2 


C = uf: (ate — 1) + Bt a; 5) 
D = flrk-D+TOtr+T) 
ab) = a(6=1)+ G(4+2B+20+D). (1.41) 


A aplicação de (1.41) na integração numérica de uma equação diferen- 
cial, ou seja, de um modelo contínuo, pode ser feita nos mesmos moldes em 
que a aproximação explícita de Euler foi usada no Exemplo 1.6.1. 

Uma das questões mais importantes na simulação de modelos contínuos 
usando métodos de integração numérica é a escolha do intervalo de integra- 
ção T. Se esse intervalo for muito longo, o algoritmo torna-se instável, ou 
seja, não converge para a solução da equação diferencial, Além disso, dife- 
rentes algoritmos de integração têm sensibilidades diferentes ao valor de T' 
utilizado. Em outras palavras, o mesmo valor de T pode ser adequado para 
um algoritmo e inadequado para outro, Para o algoritmo de Runge-Kutta 
de quarta ordem, T' deve ser pelo menos dez vezes menor do que a constante 
de tempo mais rápida do modelo, 

Situações um pouco mais difíceis de contornar são aquelas em que o 
sistema tanto tem constantes de tempo muito lentas quanto muito rápi- 
das. Para tais casos, existem algoritmos alternativos em que o intervalo de 
integração T é variável. 
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1.6.2 Modelos discretos 


A simulação de modelos discretos corresponde normalmente à solução de 
equações a diferenças. O procedimento nesse caso é direto e não requer 
nenhum algoritmo especial, como no caso de sistemas contínuos. O proce- 
dimento é melhor descrito por um exemplo. 


Exemplo 1.6.2. Simulação de modelo ARX 


Considere o modelo (1.22) apresentado no Exemplo 1.2.12. Para simular 
esse modelo é necessário escolher uma condição inicial, bem como definir 
para que entrada se deseja simular o modelo. Escolhendo-se arbitrariamente 
a condição inicial y(1) = y(2) = 14V e uma entrada que oscile entre 2,3 e 
24V da forma u(0) = u(l) = 2,3V, u(2) = u(3) = 2,4V, a simulação do 
modelo resulta em: 


y(3) = 1,7649(14) — 0,8027(14) + 0,8661(2,3) 
—0,73578(2,4) + 0,07513(2,3) = 13,8698 

v(4) = 1,7649(13,8698) — 0,8027(14) + 0,8661(2,3) 
—0,73578(2,4) + 0,07513(2,4) = 13,6474 

w(5) = 1,7649(13,6474) — 0,8027(13,8698) + 0,8661(2,4) 
—0,73578(2,3) + 0,07513(2,4) = 13,5197 

w(6) = 1,7649(13,5197) — 0,8027(13,6474) + 0,8661(2,4) 
—0,73578(2,4) + 0,07513(2,3) = 13,3917 

u(T) = 1,7649(13,3917) — 0,8027(13,5197) + 0,8661(2,3) 
—0,73578(2,4) + 0,07513(2,3) = 13,1817 


(1.42) 


A segiiência y(1),y(2),... é a resposta do conversor buck ao sinal de 
entrada u(0),u(1),... obtida a partir da simulação do modelo. [| 


Leitura Recomendada 


Conceitos básicos sobre representações lineares tais como funções de trans- 
ferência e espaço de estados podem ser encontrados em diversos textos 
introdutórios de sistemas de controle (OGATA, 1993; GEROMEL; PALHARES, 
2004; DÓREA, 2007; TAKAHASHI, 2007). Uma abordagem detalhada sobre 
sistemas lineares é apresentada em (KAILATH, 1980). Na Seção 1.2.3 foram 
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citadas as definições sobre as transformadas de Laplace, Z e de Fourier. 
Para maiores detalhes, recomenda-se que o leitor consulte um dos diversos 
livros disponíveis no assunto (KAILATI, 1980; OGATA, 1993; OPPENHEIM; 
Wiiskv, 1983; Diniz, DA Siva, NETTO, 2004). 

A literatura sobre modelagem de sistemas é muito abrangente e existem 
relativamente poucas referências especificamente sobre o assunto. Um dos 
raros livros sobre modelagem bascada na física do processo foi recentemente 
publicado por Garcia (2005). Esse livro discute o assunto e traz diversos 
exemplos de modelagem de vários sistemas distintos. Aplicações a sistemas 
mecânicos é apresentado em (ARCZEWSKI, PIETRUCHA, 1993) e, a siste- 
mas contínuos de forma geral, em (MATKO et al., 1992). Por outro lado, 
Adade-Filho e Gonçalves discutem a representação grafo de sistema para a 
modelagem simbólica de sistemas dinâmicos (1999). 

Uma situação mais comum é encontrar trabalhos sobre modelagem ma- 
temática aplicada a determinados processos. Apesar de Doebelin (1980) 
apresentar diversos capítulos detalhando a aplicação de modelagem mate- 
mática a diversos sistemas mecânicos, o livro tem diversos capítulos sobre 
técnicas de modelagem. 

O sistema de bombeamento descrito na Seção 1.4 é não-linear. Apesar 
da modelagem apresentada neste capítulo ter considerado o processo numa 
ampla faixa de operação, sintonia e validação do mesmo não foi feita para 
toda a faixa de operação. A sintonia e validação mais abrangente do modelo, 
bem como uma descrição mais detalhada do processo, pode ser encontrada 
em (SANTANA, 1998; SANTANA et al., 2002). 

Há livros especificamente sobre identificação de sistemas, que é o foco 
dos próximos capítulos. Uma introdução à identificação de sistemas lineares 
com forte ênfase em técnicas determinísticas foi apresentada por Coelho e 
Coelho (2004). Norton (1986), van den Bosch e van der Klauw (1994) 
abordam o assunto de forma menos formal do que outros livros com perfil 
mais científico (LIUNG, 1987; SÓDERSTRÔM; STOICA, 1989). Diversos 
aspectos de identificação de sitemas, estimação de parâmetros e filtragem 
de sinais pode ser encontrada em (AMARAL, 2007). 

A análise e modelagem de sistemas com dinâmica caótica é um assunto 
que tem atraído grande atenção desde a segunda metade da década de 80. 
Tais sistemas requerem alguns cuidados especiais, Uma ótima introdução 
ao assunto pode ser encontrada em (GOUESBET et al,, 2003). 

Finalmente, o assunto de simulação de modelos pode ser abordado de 
duas formas distintas, No contexto matemático, a simulação de modelos de 
sistemas dinâmicos contínuos corresponde à solução numérica de equações 
diferenciais e é abordada com essa ênfase em diversos livros de matemática 
aplicada (KREYSZIG, 1999). Por outro lado, uma abordagem mais volta- 
da para simulação de sistemas dinâmicos pode ser encontrada em livros 
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específicos da área (PARKER; CHUA, 1989). As pectos sobre a implemen- 
tação numérica de algoritmos para integração de de equações diferenciais 
ordinárias são discutidos em (CAMPOS FILHO, 2001). 


Exercícios 


1.1. Mencione algumas características de sistemas reais (por exemplo: li- 
nearidade, concentração de parâmetros etc.) e as respectivas suposições 
normalmente feitas durante a modelagem. Comente as consegiiências de 
não se fazer tais suposições em termos da complexidade do modelo resul- 


tante. 


1.2. Mostre que o sistema estático 1 = 2 + 5x, apesar de ser a equação de 
uma reta, não é linear. 


1.3. Simule o modelo (1.2) para uma entrada em degrau unitário, T = 5 
e K = 10. Simule o modelo (1.1) usando a mesma entrada. Compare e 
discuta os resultados. Dica: use modeloi O e sim modeloi O na primeira 
parte do exercício. Altere modeloi O convenientemente para simular o 


modelo (1.1). 


1.4. Considere o Exemplo 1.2.4. Que simplificação no modelo seria conse- 
guida se apenas se considerasse o ângulo de torção O no meio da viga? 


1.5. Descreva como você faria para obter os parâmetros do modelo (1.4). 


1.6. Represente o modelo no espaço de estados da Eq. 1.16 como uma fun- 
ção de transferência. Dica: aplique a transformada de Laplace ao modelo e 
lembre-se de que a função de transferência é o quociente entre as transfor- 
madas de Laplace da saída pela entrada, quando a entrada é um impulso. 


1.7. Um modelo da dinâmica da população da espécie Folsomia candida é 
dado por” 


zi(k +1) 0 O F(N) F(N)] [ m(k) 
co(k+1) | | S(N) O 0 0 za(k) 
e(k+1) [2] 0 SN) O 0 za(k) |? 
cu(k + 1) o 0 SN) 0 za(k) 


"Sumezev; LoGorET, 1983. p. 73, 
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sendo que x;(k) é a população da i-tsima faixa etária no instante k. O 
tempo entre amostras é uma semana, ou seja, o modelo determina as po- 
pulações das quatro faixas numa determinada semana a partir dos valores 
respectivos uma semana antes. F(N) e S(N) são, respectivamente, funções 
que descrevem a fertilidade e a sobrevivência da espécie e são: 


) 


F(N) 
sS(N) 


18,53n N — 1,74(In N)? — 44,04; 
1,35 0,14In N, 


] 


sendo que N é a população total, ou seja, N = z;+Zz2 +23 +z4. Inicialize o 
modelo de forma a ter N > 42 e simule o modelo por tempo correspondente 
a 25 semanas. 


1.8. A seguir mostra-se um modelo matemático normalizado que descreve 
a dinâmica de uma cadeia alimentar (UPADHYAY; JYENGAR, 1998) 


Ty 
yr (er) feeginci ts 
Apt z+a 
jo ty a EL ve 
= td pre (1.43) 
2 
FA 
io 


sendo que z é a densidade normalizada da presa ao fim da cadeia alimentar, 
y é a densidade normalizada do predador especialista (que somente se ali- 
menta da presa) e z é a densidade normalizada do predador generalista (que 
tanto se alimenta da presa quanto do predador especialista). Os valores dos 
parâmetros para esse modelo são: 


a=0811 e=0161 b=0,518 f=4,599 
c=1,0386 9=2469 d=0311 h=0,322. 


Com relação a esse modelo, classifique-o conforme as definições apresen- 
tadas na Seção 1.2.2. Simule esse modelo a fim de obter a evolução temporal 
das três espécies componentes da cadeia alimentar. 

O seguinte modelo foi obtido aplicando técnicas de identificação de sis- 
temas a um trecho de dados correspondentes à observação da evolução da 
densidade de presas do modelo (1.43) (LETELLIER et al., 2002): 


4 
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e(k) = 3,380402(k — 1) — 4,30812x(k — 2) + 2,56162 2(k — 3) 
-1,06161 x(k — 4) — 1,21955 22(k — 5) 
+2,56978 e (k — 1)z(k — 5)x(k — 6) 
—83,26196 x (k — 3)x(k — 4)x(k — 6) + 0,48632 x(k — 5) 
+2,53047 22(k — 4)z(k — 5) + 0,80920 2(k — 4)z(k — 7) 
—4,55223 x 10-3z2(k — 1)z(k — 8) + 1,47483 2(k — 3)z(k — 6) 
—0,2371622(k — 5)z(k — 6) — 0,74444 z(k — 1)z(k — 7) 
—0,4531222(k — 6) + 0,50283 22(k — 2)z(k — 3) 
—2,02429 2(k — 1)z(k — 4)x(k — 5). 
(1.44) 


Simule o modelo (1.44) usando as seguintes condições iniciais: 
y(k=1) = 0,9432, y(k—2) = 0,9353, y(k—3) = 0,9203, y(k— 4) = 0,8962, 
y(k—5) = 0,8621, y(k—6) = 0,8151 e y(k—7) = 0,7591. Classifique o 
modelo (1.44) conforme as definições apresentadas na Seção 1.2.2. Compa- 
re os resultados dessa simulação com aqueles obtidos anteriormente para o 
modelo (1.43). 


1.9. A seguir mostra-se um modelo matemático que descreve a dinâmica 
do vírus HIV e células CD4 em função de doses de fármacos (CAETANO; 
YONEYAMA, 2002) 

ty = S(x4) + Mxixo,z3)7 — milgm + ka(ma (t)) 4) 

to = wki(ma(t))zaz — za[pu2 + ko(mo(t))] 

ta =(1—w)ki(mi(t))zaz + ko(mo(t))zo — uaza 

ty = N(bBuaza — zalki(ma(t))m + pu], 


(1.45) 


so 
S(m) = ERA 
Azzaro) = r (1 = atata) ) 
max 
N(t) = Ba(Bo — NojeÊt, 


sendo 2, o número de células T CD4+ não infectadas, xo o número de células 
T CD4* infectadas latentes, z3 o número de células T CD4+ infectadas 
ativas, z4 O número de vírus HIV livres, s taxa de geração de x, r taxa de 
crescimento estimulado de x, Tmax nível máximo da população de células 
T, ui taxa de mortalidade de z;, ty taxa de mortalidade de x4, k taxa 
de infecção por vírus de 7, para x2, kz taxa de conversão de x2 para 23, 
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8 concentração de vírus necessária para reduzir s. Os coeficientes ky e kz 
dependem das doses de fármacos mi (t) e ma(t) da seguinte forma: 
kama (8)) 
ka(ma(t)) 


krge-Suma(t) 


hope S2ma(), 


As seguintes constantes podem ser usadas para fins de simulação: 


s=10 r=0,52 Tmax = 1700 m=0,4 
n2=05 n=00 m=24 ko =2,4x 1075 
ko =3x 107! No=140 w=l1 01 = 09 = 0,005 


Bi=1x10"! 8,)=65470 0=1x 10º. 


Simule o modelo acima partindo das seguintes condições iniciais 
z1(0) = 357, zo(0) = 10, z3(0) = 100 e z4(0) = 133.352 até o instante 
t = 224 com intervalo de integração T = 0,1. Use sinais hipotéticos sua- 
ves para as doses de fármacos, limitando seus valores às seguintes faixas: 
300mg < mi(t) < 900mg e 300mg < ma(t) < 900 mg. 

Em trabalho semelhante, Piqueira e colegas (2004) desenvolveram um 
modelo para estudar a dinâmica de transmissão do vírus HIV entre homose- 
xuais. Tal modelo foi obtido por considerações de comportamento, ou seja, 
é um modelo caira branca. Questões de modelagem, simulação, análise e 


controle de modelos de epidemias podem ser encontradas em (NEPOMUCE- 
NO, 2005). 

1.10. A representação de função de transferência discreta está fortemente 
relacionada com a representação ARX determinística. Coloque a função de 
transferência (1.14) na forma de um modelo ARX. Dica: lembre-se de que 
z1 no domínio z está relacionado com o operador de atraso, ou seja, se 
Y(z) = Z(y(k)), então y(k-1)=2"!2-!Y (2))=q" !y(k), para o caso de 


1.11. Use o procedimento inverso ao do exercício anterior e coloque o mode- 
lo ARX (16.16) na forma de uma função de transferência em tempo discreto. 
Simule o modelo (16.16), conforme sugerido no Exemplo 1.2.12. 


1.12. Considere o seguinte modelo ARX: | 
uk) = my(k — 1) + aou(k — 2) + byu(k — 1). 


Proponha uma forma para determinar os parâmetros desse modelo. Discuta 
o que seria necessário para poder determinar tais parâmetros. 
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1.13. Discuta semelhanças e diferenças existentes nos problemas de identi- 
ficação de sistemas e de estimação de parâmetros. 


1.14, Discuta que consegiiências teria se no Exemplo 1.3.2 houvesse ruído 
significativo nos dados de calibração. Você consegue imaginar uma solução 
para o problema? 


1.15. Quais são as principais etapas envolvidas na identificação de um 
sistema? 


1.16. Quais são as principais características da modelagem pela natureza 
do processo e da identificação de sistemas? Em uma determinada situação 
prática, que fatores podem ser levados em conta para se optar por uma 
dessas técnicas? 
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Representações Lineares 


2.1 Introdução 


Conforme visto no capítulo anterior, um modelo matemático de um sistema 
é um análogo de tal sistema. Há diversas maneiras de representar o mesmo 
modelo matemático, ou seja, há várias formas em que as equações que 
descrevem o comportamento do sistema podem ser escritas. Será chamada 
de representação a forma em que um modelo matemático é expresso. 


No presente capítulo, serão descritas algumas representações lineares. 
Seria impossível tentar descrever todas as representações existentes, mas 
as mais comuns são aqui revistas. No Capítulo 10, serão apresentadas 
representações matemáticas comumente usadas na modelagem de sistemas 
não-lineares. 


Uma das representações mais importantes na modelagem de sistemas 
dinâmicos lineares é a função de transferência, mencionada na Seção 2.2. 
Essa representação será descrita, e conceitos importantes — referentes à res- 
posta temporal, à resposta em fregiiência e à decomposição modal — serão 
discutidos no contexto de funções de transferência. Uma outra maneira 
muito útil de expressar um modelo dinâmico linear é usando representação 
em espaço de estados, mencionada na Seção 2.5, Essas duas representações 
serão apresentadas no contexto de sistemas contínuos no tempo, mas exis- 
tem os análogos para o caso de tempo discreto. Essas representações serão 
brevemente mencionadas, bem como as relações que permitem passar de 
uma representação para a outra. Finalmente, a representação ARMAX (do 
inglês autoregressive moving average with exogenous inputs) será descrita, 
uma vez que diversas das técnicas de indentificação descritas no livro serão 
baseadas nessa representação. 
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2.2 Funções de Transferência 


Funções de transferência são funções que modelam o comportamento di- 
nâmico de um par entrada-saída de um sistema, ou seja, descrevem como 
uma determinada entrada é dinamicamente “transferida” para a saída do 
sistema. 

A função de transferência (FT) de um sistema é, por definição, a trans- 
formada de Laplace da sua resposta ao impulso. Para sinais de entrada com 
espectro de fregiiência suficientemente amplo, uma estimativa da função de 
transferência de um sistema pode ser obtida dividindo-se a transformada 
de Laplace da saída pela transformada de Laplace da entrada. Assim, fun- 
ções de transferência são normalmente representadas como a razão de dois 
polinômios em s. 

Um problema típico de modelagem de sistemas lineares é o de obter a 
função de transferência do sistema em estudo. Isso pode ser feito aplicando- 
se a transformada de Laplace à equação diferencial que descreve o sistema. 
A equação diferencial, por sua vez, é normalmente obtida considerando-se as 
leis que descrevem os fenômenos envolvidos, conforme ilustrado no seguinte 
exemplo. 


Exemplo 2.2.1. Função de transferência de um circuito elétrico 


As equações que descrevem o circuito mostrado na Figura 2.1 são as 
seguintes: 
di(t) 


Lã + Ri(t) + ve(t) = vt), (2.1) 
dvlt) 
ETR = i(t). (2.2) 
R L 


v(t) JC vt) 
i(t) 


FIGURA 2.1: Circuito RLC 


Circuito usado no Exemplo 2.2.1. 


Deseja-se obter a função de transferência entre a tensão de alimentação 
v(t) e a corrente no circuito i(t), ou seja, deseja-se obter H(s) = I(s)/V(s). 
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Aplicando-se a transformada de Laplace às Egs. 2.1 e 2.2, tem-se, respecti- 
vamente, 


LI(s)s + RI(s) + Vo(s) = V(s), (2.3) 


CVe(s)s = I(5). (2.4) 


Da Eq.2.4, tem-se Ve(s) = 1/Cs. Substituindo-se esse resultado em 
(2.3), chega-se a 


I(s) Cs 


V(s) CLS+ROs+I 


(2.5) 


[a] 


Funções de transferência podem também ser obtidas diretamente a par- 
tir de dados produzidos pelo sistema usando-se métodos de identificação 
descritos a partir do próximo capítulo. 

O objetivo desta seção é estudar os elementos fundamentais da estrutura 
de funções de transferência. Tais elementos são os pólos, zeros e os resíduos. 
Estes caracterizam a resposta temporal e a resposta em freqiiência de uma 
função de transferência. Conhecendo como tais elementos afetam a resposta 
temporal e a resposta em freqiiência de uma função é possível, sem recorrer 
a simulações, ter uma idéia do comportamento qualitativo de funções de 
transferência simples. 


2.2.1 Pólos, zeros e resíduos 


Considere a seguinte função de transferência: 


H(s) = N(s) A bo+bis+...+ bos? 
D(s) aotas+...+ans" 

Os zeros de H(s) são os valores de s = 21,22... ,2q, para os quais H(s) 
énula. Em outras palavras, os zeros de H(s) são os zeros do polinômio N(s). 

Semelhantemente, os pólos de H(s) são os zeros do polinômio D(s), isto 
é, valores de s = p1,P2,-+- »Pn, para os quais D(s) é zero. 

A multiplicidade de um pólo ou zero é igual ao número de vezes que tal 
singularidade aparece repetida na função de transferência. Por exemplo, se 
22=23=24 = 1, então a multiplicidade do zero em s = —1 é igual a três. 

Por motivos de precisão numérica, modelos de sistemas reais normal- 
mente não possuem pólos com multiplicidade maior do que um. Uma 
exceção talvez sejam os pólos na origem (em sistemas com integração). 
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A ordem de uma função de transferência é igual ao número de pólos, 
ou seja, igual a n. Para funções de transferência de sistemas reais tem-se: 
n > q (funções de transferência próprias) ou n > q (funções de transferência 
estritamente próprias). A impossibilidade de se ter q > n em sistemas reais 
fica evidente quando se considera a resposta em fregiiência de funções de 
transferência, como será visto na Seção 2.4. A condição q > n equivaleria a 
um sistema passa altas para frequências w — 00. 

Tanto os pólos quanto os zeros de uma função de transferência podem ser 
reais ou complexos. Quando pólos ou zeros forem complexos, eles aparecerão 
em pares conjugados, isto é, se a + jf for um pólo (ou zero), então a — jB 
também será um pólo (ou zero) do sistema. Um par complexo é representado 
por a jp. 

Para sistemas reais, pólos e zeros complexos sempre aparecem em pa- 
res conjugados porque os coeficientes das funções de transferência (ou das 
respectivas equações diferenciais) são reais (massas, resistências, constantes 
de mola etc.). 

Se pelo menos um pólo de uma função de transferência satisfaz a con- 
dição 


Relpi] > 0, i=1,2,... 41, 


sendo que Rel") indica a parte real do pólo, tal função de transferência é 
instável. 

Se Relp;] < 0, i = 1,2,...,n, a função de transferência é estável, e 
se Relpi] < 0, i = 1,2,...,n, à função de transferência é assintoticamente 
estável. A razão para tal nomenclatura será vista na próxima seção. 

No caso dos zeros, tem-se que se Re[2;] > 0, i = 1,2,... ,q, a função de 
transferência é de fase não mínima, caso contrário, ela é de fase mínima. 

A fim de definir os resíduos dos pólos de H(s), tal função de transferência 
pode ser reescrita como se segue: Í 


= (sas 22)...(s— 29) 
DU (oa pitada: (2.6) 


Portanto, o resíduo de H(s) no pólo p;, Ji, é definido como 


Ji = H(s)(s—pi) | (2.7) 


s=p;" 


Da Eq. 2.7 fica evidente que tanto os zeros quanto os pólos são usados no 
cálculo dos resíduos. Além disso, como será visto mais adiante, os resíduos 
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correspondentes a um par de pólos complexos e conjugados também serão 
complexos e conjugados. 

O conceito do resíduo de um pólo de uma função de transferência é 
muito útil na decomposição modal, que, por sua vez, é utilizada para se obter 
a resposta temporal de uma função de transferência, conforme descrito a 


seguir. 


2.2.2 Decomposição em frações parciais 


A decomposição em frações parciais ou decomposição modal, sendo que cada 
termo do tipo J;/(3+p;) representa um modo, é análoga à forma canônica de 
Jordan na representação no espaço de estados, como veremos mais adiante. 
Tal decomposição é muito útil na análise de sistemas lineares. A motivação 
básica para decompor uma função de transferência é poder separá-la em 
“módulos básicos” cuja resposta pode ser facilmente obtida em tabelas de 
transformada de Laplace (ver Anexo D). Dependendo dos pólos da função 
de transferência, três casos distintos serão abordados: i) pólos reais não 
repetidos, ii) pólos complexos não repetidos, e iii) pólos com multiplicidade 
maior do que um. 


Pólos reais de multiplicidade unitária. A função de transferência (2.6) 
pode ser decomposta da seguinte forma: 


EPE RP TR (2.8) 
s-p s-m 5-Pn 


H(s) = 


se todos os pólos forem reais e a sua multiplicidade for igual a um, ou seja, 
se não houver pólos repetidos. Os coeficientes J; são os resíduos e estes 
serão reais ou complexos conjugados se os respectivos pólos forem reais ou 
complexos conjugados. A Eq.2.8 é chamada de decomposição em frações 
parciais de H(s). 


Exemplo 2.2.2. Decomposição modal (pólos reais e distintos) 


Seja a função de transferência com p; = -1,pp=-2ep3;=—3 


5s+3 


“EC+HDC+ME+I (2.9) 


H(s) 


Neste caso, H(s) pode ser decomposta como se segue: 


A d Ja 
Hs seltara tres 
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sendo 


h= H()s+1) | =-1 


Semelhantemente, têm-se Jo = 7 e Jy = —6. Portanto, a decomposição 
em frações parciais de H(s) é 
=1 7 —6 
TS ES TT 
[| 


Pólos complexos de multiplicidade unitária. Supondo que na fun- 
ção de transferência (2.6) os pólos p, e p2 sejam complexos conjugados, a 
decomposição em frações parciais é feita da seguinte forma: 


É 


H(s) Ka 
s-p, s-p 8S-pP3 8-=Pn 
J J; J 
= RE ERR 
8s-p. 8=P, SP S-Pn 
A os + 02 Jj pe Jn 


—L E 
(s-pils-pi) s-ps s-Pn' 


sendo que pj = pa e Jj = Jp são, respectivamente, os complexos conjugados 
de p; e h. Também, q = Ji + Jj = 2Re[h) e ao = (pJj + pi). Os 
resíduos complexos podem ser obtidos usando-se (2.7), normalmente. 


Exemplo 2.2.3. Decomposição modal (pólos complezos e distintos) ! 


A função de transferência 


s+1 

H(s)==————— 
(s) (2 +s+1)' 

com pólos em s = —0,5 + 30,866 e s = 0, pode ser decomposta em frações 

parciais da seguinte maneira: 


J Jy J: 

1,4 O 45 
s-p sS-p ss 

os + 9 +A 
(s-pls-pi) Ss 


H(s) 


1Ocara, 1993. p. 45. 
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Aplicando-se (2.7), obtém-se 


É 1 a j 
di = Eros |ra=p= 0200 = —0,5 + 90,2887, 


sendo que, claramente, Jf = —0,5 — 70,2887, Além disso, tem-se 


q = 2Refh]=2(-0,5)=-1,0 
q = (pJi+ph) 
= —[(-0,5-50,866)(-0,5-70,2887)4(=0,5+j0,866) x 
x(=0,5+70,2887)] 
0. 


H 


O resíduo do pólo na origem do plano s é determinado da seguinte forma: 
= dt = 
h=5 PES | =1. 


Portanto, a decomposição de H(s) é 
—8 | 
Hs ETs 


[nm] 


Pólos com multiplicidade maior do que um. Suponha que uma fun- 
ção de transferência H(s) = N(s)/D(s) tenha o seguinte polinômio por 
denominador: D(s) = (s— pi)"(s — pr41)...(s — Pn). A decomposição em 
frações parciais é dada por 


b bem 


by 
H ->—1.+——— +... +—— + 
O = tmp 'G-mattt-m) 
E ÇA (2.10) 
8-—Ppr4 S—Pn 
sendo que bi, i = 1,... ,r são dados pelas seguintes relações: 
dr = Hos-p) | 
ba = EH) -p)) om 
ú 
br = háslH(o)(s =p) op 
bh = és le(so(s-p) Ip 
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Exemplo 2.2.4. Decomposição modal (pólos múltiplos) 2 
Seja a seguinte função de transferência: 


2 +25+3 


dc aa Sh 


H(s) pode ser decomposta em frações parciais como se segue: 


bg bo b 
HO) = Ate! + 
sendo 
by = H(s)(s +13 |,..,=2 
b = & [H(s)(s +19] |,..,=0 


bh = hálHo(s+P] | =1. 


[mm] 


Num sistema de ordem elevada (n grande e consegiientemente com mui- 
tos modos) é possível que alguns modos sejam mais importantes para descre- 
ver o comportamento do sistema do que outros. Tais modos são chamados 
de modos dominantes. Aqueles modos que podem ser desprezados em mo- 
delos aproximados são chamados de modos não dominantes. 

É importante poder determinar se um modelo tem modos dominantes 
e quais são eles, pois, neste caso, é normalmente possível obter modelos 
reduzidos de forma simples. A dinâmica de muitos processos industriais 
pode ser descrita por modelos com apenas um ou dois modos, com e sem 
atraso puro de tempo. 

Muitos processos industriais podem ser modelados matematicamente 
por funções de transferência da forma 


. K(s-aietas 
HO = sms Him" 


sendo que 7 e 72 são constantes de tempo, Tg é O atraso puro de tempo, i é o 


número de “integradores puros”, r é a multiplicidade do pólo em s = —1/72 
2Ocara, 1993. 
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es = zé um zerode multiplicidade j que pode ser positivo, resultando 
numa função de transferência de fase não mínima. No próximo capítulo, 
será descrito um método que permite estimar os parâmetros de funções de 
transferência desse tipo para jy =i =0er =1,a partir da resposta ao 
degrau do sistema. 


A vantagem de descrever a dinâmica de um processo dinâmico por meio 
de funções de transferência é que existe um grande número de resultados 
disponíveis, especialmente na área de projeto e sintonia de controladores. 
Além disso, é prático, e até mesmo intuitivo, caracterizar a dinâmica de 
processos em termos dos parâmetros K, Tg, T1 € Ta. 


Muitas vezes, o processo de modelagem de um determinado sistema di- 
nâmico resulta num modelo de estrutura mais complexa. Em tais casos, 
métodos de redução de modelos podem ser utilizados para se obter uma 
representação mais simples do processo. Há uma grande diversidade de mé- 
todos de redução de ordem de modelos, sendo que a forma pela qual tais 
métodos derivam os modelos de ordem reduzida também é muito diversifi- 
cada. Alguns métodos são apresentados na Seção 14.3. Uma das maneiras 
de simplificar um modelo dinâmico é quantificar a importância dos seus 
modos e eliminar aqueles de menor importância. Esse procedimento usa, 
portanto, o conceito de dominância modal. 


O procedimento mais comumente usado para verificar dominância modal 
é notar o módulo das constantes de tempo envolvidas. Assim, se uma 
constante de tempo for muito (dez vezes) menor do que a maior constante 
de tempo do sistema, o respectivo modo é considerado não dominante e 
pode, pelo menos em princípio, ser desprezado num modelo mais simples. 
Em outras palavras, se 7; > 10 x 7», então o modo J2/(728 + 1) pode, em 
princípio, ser desprezado. 

Entretanto, esse procedimento pode dar uma indicação inadequada da 
dominância modal de um sistema, pois ele só leva em conta as constantes 
de tempo. Uma forma mais consistente, e ainda muito simples, utiliza, 
além das constantes de tempo (pólos), os resíduos do sistema. Os índices 
neste caso são chamados MDI (Modal Dominance Indices) e são definidos 
da seguinte forma para pólos reais: 


para pólos complexos. As definições acima serão discutidas em detalhe na 
Seção 14.2. 


Digitalizado com CamScanner 


102 2 REPRESENTAÇÕES LINEARES 


Exemplo 2.2.5. Redução de ordem usando dominância modal 


A dinâmica de uma malha real de controle de combustíveis, num deter- 
minado ponto de operação, é descrita pela seguinte função de transferência 
(PENA et al., 1990): 


7,5265º + 10,35752 + 0,920515 + 0,63827 


H(s) = 30014155 + 11,74957 + 16,98752 + 1,1602s 1º 


(2.11) 


que tem pólos em s = —0,2795 + 30,88306 e s = —0,0141 + 50,2547. Co- 
mo a parte real do par de pólos lentos é quase vinte vezes menor do que 
a do par de pólos rápidos, o procedimento padrão seria descrever a di- 
nâmica da planta usando-se os pólos lentos. Entretanto, observando-se 
que os resíduos nestes pólos são os pares Jj2 = 0,18235 + j0,24077 e 
J3,4 = 5,6638 x 10-3 + 52,2615 x 1073, respectivamente, os MDI podem ser 
calculados como se segue: 


— m [ 018285 +70,24077] 
tis Re [o = 70,88306 ) — 032676 

[5,6638 x 1053 922615 x 1053 Es 
ma=-Re[ UOL E 702547 = —7,6281 x 107. 


Os valores percentuais são | 71,2] = 48,86% e |%)34| = 1,14%, respec- 
tivamente, o que deixa claro que a dinâmica da planta provavelmente será 
melhor descrita usando-se os pólos rápidos. A fim de ilustrar este ponto, 
obtiveram-se modelos simplificados de segunda ordem onde os pólos 3,4 e 
“1,2, respectivamente, foram retidos. As funções de transferência simplifi- 
cadas são: 


2,9668 x 10-25 + 4,1527 x 102 


Rio) = 7428134 x 10-25 + 6,506 x 102 
0,49496s + 0,49017 
Ro) = 740558905 +0,76197' (2,12) 


sendo que Ri(s) tem os pólos lentos da função de transferência original 
e Rr(s) foi obtida retendo-se os pólos rápidos. Os numeradores de tais 
funções de transferência foram obtidos impondo que Ri(s) e Rr(s) tenham os 
dois primeiros coeficientes de Padé idênticos aos do modelo original (2.11). 
No presente exemplo, entretanto, o objetivo é salientar que, em geral, a 
aproximação conseguida pelo modelo Rr(s) é melhor do que a de Ri(s), 


| 
O] 
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conforme pode ser visto na Figura 2.2. Essa figura confirma a hipótese de 
que, neste caso, os pólos mais rápidos são de fato os dominantes. 

Deve ser observado que neste exemplo os índices 7 foram usados apenas 
para decidir quais pólos reter no modelo reduzido. 


FIGURA 2.2: Resposta ao degrau de modelos reduzidos 


Resposta ao degrau do (—) modelo original e dos modelos simpli- 
ficados (---) Ri(s) e (--) Rr(s) (ex22 0). 


Os coeficientes dos numeradores de Rr(s) e de Ri(s) foram calculados 
de forma a ajustar coeficientes de Padé da função de transferência original. 
Esse procedimento será detalhado na Seção 14.3. [a] 


2.3 Resposta Temporal 


Por definição, a função de transferência é a transformada de Laplace da 
resposta ao impulso. Conseqientemente, a resposta temporal ao impulso 
pode ser obtida usando-se a transformada inversa de Laplace da respectiva 
função de transferência. 

A resposta temporal y(t) de um sistema, cuja resposta ao impulso é 


h(t), quando excitado por uma entrada u(t), pode ser obtida da seguinte 
forma: 


v(t) = 2(Y(s)) = 27 (H(S)U(S)), (2.13) 
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sendo que Y(s), H(s) e U(s) são, respectivamente, as transformadas de 
Laplace de y(t), h(t) e u(t). A expressão (2.13) sugere que é necessário 
se conhecer, além da função de transferência do sistema, a transformada 
de Laplace do sinal de entrada. As transformadas de Laplace de diversos 
sinais básicos podem ser obtidas diretamente de tabelas. Por exemplo, 
as transformadas de Laplace do impulso, degrau e rampa unitários são, 
respectivamente, 1, 1/s e 1/52. As respostas ao impulso e ao degrau são 
muito úteis em identificação de sistemas usando-se métodos determinísticos, 
como será visto no próximo capítulo. 

Dada uma função de transferência, H(s), uma maneira de se obter a sua 
resposta temporal a uma entrada u(t) é tomar a transformada de Laplace 
desse sinal e multiplicá-lo por H(s). A seguir, deve-se decompor o produto 
H(s)U(s) em frações parciais e tomar as transformadas de Laplace inversas 
de cada um dos modos. A resposta do sistema completo será a soma das 
respostas individuais, conforme ilustrado no próximo exemplo. 


Exemplo 2.3.1. Resposta temporal de uma função de transferência 


A resposta ao impulso de H(s) em (2.9) é h(t) = L-!(H(s)), ou seja, 


cmo -e(ibee foro (58) 


ou 
h(t) = -e t+ 7% — ge, 

A resposta ao impulso de H(s) em (2.9) e de cada um dos seus modos 

é mostrada na Figura 2.3. [m] 


No próximo exemplo, o mesmo procedimento será seguido para se obter 
a resposta temporal do modelo reduzido (2.12), que é composto de um modo 
oscilatório amortecido. 


Exemplo 2.3.2, Resposta temporal de modelo reduzido 


A resposta ao degrau de Rr(s) (ver Exemplo 2.2.5) é 


" 1 / 0,494965 +0,/49017 1 
)=C!(R E rg pn , debe, 
nose pe (x +0,55890s + 0,76797 a) 
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A decomposição em frações parciais resulta em 
Jis+ dh J 
R(SU(S) = 777,55890s +0,70707 * a 


ou 
—0,6385 
Re(sJU(S) = 770,558005 + 0,70707 
0,138 0,638 
+ Ee 


+ + 0,55890s + 0,76797 
Finalmente, tomando-se a transformada inversa de Laplace, tem-se 
lt) = 68 02 gon(0,83068 na) 
e 
0,138 0,8763 oz 
po 0,76797 VIM” sen(0,8306t) + 0,638, 
sendo que 4 = tan-1/(1 = (9)/€ = tan"! (1 — 0,1017)/0,3188 = 1,25 rad 


ou q =71,4º. A resposta y(t) em (2.14) é a curva tracejada da Figura 2.2. 
[m] E 


(2.14) 


Resposta ao impulso de uma FT e de seus modos 


FIGURA 2.3: 
Resposta ao impulso da (—) função de transferência (2.9) e dos 
três modos (---) —1/(s + 1), (- -) 7/(s+2) e (:-:) —6/(s +3) 
(ex22 0). 
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2.8.1 Funções de transferência de primeira ordem 


Os dois exemplos anteriores mostraram que funções de transferência de 
ordem maior que dois podem ser decompostas em subsistemas de ordem 
baixa, ou seja, primeira e segunda ordem. Portanto, é importante conhecer 
bem as características dinâmicas de sistemas de baixa ordem, uma vez que 
sistemas mais complexos podem, normalmente, ser decompostos em tais 
componentes mais simples. No restante desta seção, a resposta temporal de 
primeira e segunda ordem serão analisados. 
Considere a função de transferência de primeira ordem 


K 


TE prdo) 


H(s) = 


sendo que K é o ganho, e 7, a constante de tempo. 7 caracteriza a veloci- 
dade com que o sistema responde a uma certa entrada. Muitos processos 
industriais reais podem ser descritos por funções de transferência desse ti- 
po. À resposta ao impulso da função (2.15) pode ser obtida diretamente da 
tabela de transformadas de Laplace como 


h(t)=CHH(s)) = Et, 


A resposta ao degrau, por sua vez, pode ser obtida tomando-se a trans- 
formada inversa de Laplace de H(s)/s, uma vez que 1/s é a transformada 
de Laplace do degrau unitário. Para isso, é conveniente escrever H(s) da 
seguinte forma: 


K/r 
s+1/7' 


H(9) = 


Decompondo-se H(s)/s em frações parciais resulta em 


H(s) Kir dh bd 


s s(s+1/7) Cord” é 


sendo que dj = —K e Jp = K. Portanto, usando-se a tabela de transfor- 
madas de Laplace do Anexo D, obtém-se 


v)=1" (Fel =K (1-0). 
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Usando-se a última equação é fácil ver que após 7 unidades de tempo 
da resposta ao degrau um sistema de primeira ordem terá atingido 63,2% 
de sua variação total (ver Exercício 2.6). 

A Figura 2.4 mostra a resposta ao degrau unitário da função de transfe- 
rência de H(s) = 1/(75+1) para 7 =2, 4, 6, 8e 10s. Observe como a cons- 
tante de tempo 7 determina a velocidade de resposta do sistema. Quanto 
maior for a constante de tempo, mais lenta será a resposta dinâmica a uma 
perturbação na entrada. 


12 


º 5 10 15 2 as E as “o 


FIGURA 2,4: Resposta ao degrau de sistemas de primeira ordem 


Resposta ao degrau unitário de H(s) = 1/(rs + 1) para 7 =2, 4, 
6, 8e 10s (abaco O). 


2.3.2 Funções de transferência de segunda ordem 


Considere a função de transferência de segunda ordem 


2 


Se Un 
asa + Uns + w2 2:10) 


sendo que a fregiiência natural wn e o quociente de amortecimento ( são os 
parâmetros que determinam as características dinâmicas do sistema. Deve 
ser notado que um ganho K 1 pode ser facilmente incluído em (2.16). 
O polinômio do denominador de (2.16) é dito mônico, pois o coeficiente do 
termo de mais alto grau é unitário. 

A função de transferência (2.16) pode ser usada para modelar sistemas 
oscilatórios se 4 < 1, o que resultará em pólos complexos conjugados. Sis- 
temas de segunda ordem com pólos reais (( > 1) podem ser analisados 
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usando-se os resultados da seção anterior e o princípio da superposição. 
Dependendo do valor do quociente de amortecimento, a resposta tempo- 
ral de sistemas de segunda ordem pode ser classificada como subamortecida 
(0<€< 1), criticamente amortecida, (€ = 1) ou sobreamortecida, (( > 1). 

A resposta ao impulso de (2.16) pode ser obtida diretamente da tabela 
de transformadas de Laplace como sendo 


Wn —Çunt, 
h(t) = e Suntsen(wn 1 — (2 t). 2.17 
(8) VI-E (unv1— 622) (2.17) 
A resposta ao degrau pode ser obtida tomando-se a transformada inver- 
sa de Laplace de H(s)/s, como ilustrado na Seção 2.3.1 para sistemas de 
primeira ordem. Portanto, 


—Cunt 
h()=1- q (uni -Qt+tantyI- CH) - (218) 

Observando as Egs. 2.17 e 2.18 torna-se evidente que a resposta de sis- 
temas de segunda ordem subamortecidos pode se entendida basicamente 
como uma oscilação de fregiiência wn/1 — (2 limitada por um “envelope” 
exponencial com uma constante de tempo de amortecimento de 1/(wn, para 
o caso de sistemas estáveis. 


º 5 10 15 


FIGURA 2.5: Resposta ao degrau de sistemas de segunda ordem 


Resposta ao degrau unitário de H(s) = 1/(s? + 2(s + 1) para 
(=0,1,0,4, 0,7, 1,0 e 1,3 (abaco O). 


A resposta transitória de um sistema de segunda ordem subamortecido 
pode ser caraçterizada pelas seguintes grandezas: atraso puro de tempo Tg, 
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tempo de subida tr, instante de pico to, sobre-sinal (overshoot) M e tempo 
de acomodação ts. 

Para sistemas de segunda ordem do tipo analisado acima, as seguintes 
relações podem ser obtidas (OGATA, 1993): 


pra sÊ 
wa 
m 
to = es 
o wa 


M = emsivi-e 
ts 4/Guwn (2%) 
ts = 3/Cuwn (5%), 


] 


sendo que wa = wn/L =? é a parte imaginária dos pólos de (2.16) e 4 o 
ângulo associado ao par de pólos, ou seja, & = tan! (jwa)/(Çwn). O atraso 
puro de tempo 74 é o tempo que o sistema leva para começar a responder 
a uma excitação na sua entrada. Formas de estimar 7q serão vistas nos 
próximos capítulos e sua representação matemática é brevemente descrita 


a seguir. 


2.3.3 Funções de transferência com atraso puro de tempo 


Muitos sistemas dinâmicos reais apresentam um atraso puro de tempo. A 
modelagem matemática desse fenômeno é de suma importância porque atra- 
sos de tempo têm efeito desestabilizador em malhas de controle. Consegiien- 
temente, é desejável que um modelo a ser usado em projetos de sistemas 
de controle inclua o retardo puro de tempo sempre que o sistema original 
apresente tal característica. 

A transformada de Laplace de uma função f(t) é definida como 


F(s) = ) y fre dr. (2.19) 


Um atraso de 74 unidades de tempo nessa função pode ser representado 
como f(t — 74). À transformada de Laplace da função com o atraso é 


Fa(s) = E fr - re dr. 


Substituindo-se 7 = t — Tg na Eq. 2.19, tem-se 
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F(s) 


u 


00 
[ ft = mae St-raddr 
0 


[re-meras 
0 
- Fa(s), 


cotas F(s) 


ou seja, atrasar uma função temporal de 7q unidades de tempo, no domínio 
de Laplace é representado multiplicando-se a transformada da função por 
er7as, Q efeito dessa multiplicação na resposta temporal é simplesmente o 
de deslocar o sinal de excitação de rg unidades de tempo, ou seja, atrasar 
a função temporal. 

Uma dificuldade com a representação usada acima para o atraso puro de 
tempo é que e”74º não pode ser expresso como uma razão de polinômios em 
s com grau finito. Assim, não é possível representar exatamente sistemas 
com atrasos puros de tempo por meio de funções de transferência. Contu- 
do, é possível representar e-74º de forma aproximada como uma razão de 
polinômios em s, usando aprozimações de Padé (ver Seção 14.3) como se 
segue: 


TO Qn(=tas) 
eus as Ra(8) Quad] (2.20) 
sendo 
Qn(s) = ) (et (ras)"7) (2.21) 
ki Mn — 5)! , i 


As Egs. 2.20 e 2.21 sugerem que o atraso puro de tempo necessitaria de 
uma função de transferência de ordem infinita para sua perfeita aproxima- 
ção. Por isso, sistemas de primeira e segunda ordem com atraso puro de 
tempo não são sistemas de baixa ordem e, em malhas de controle, podem 
produzir oscilações mesmo usando controladores puramente proporcionais. 
Outras aproximações para o atraso puro de tempo podem ser encontradas 
em (GOMES DA SILVA; LEITE, 2007). 


Exemplo 2,3.3, Aprozimação de atraso puro de tempo 


A resposta aproximada ao degrau da função de transferência 
H(s) =e*/(s+1) pode ser obtida utilizando-se (2.20) e (2.21). As apro- 
ximações para o atraso puro de tempo usadas neste exemplo foram: 
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-s+2 
Rito) s+2 

s2-6s +12 
Rolo) = aro 


Ria =sº + 125? — 60s + 120 
S) É 53 1252 + 605 + 120º 
(2.22) 


sendo que Ri(s) = Ro(s) = Ra(s) = e*. 


FIGURA 2.6: Resposta ao degrau de sistemas com atraso 
Resposta ao degrau unitário de (—) H(s) = e-*/s+1 e das 
respectivas funções de transferência utilizando aproximações para 
o atraso puro de tempo de (:-:) Ri(s), (—-—) Ra(s) e (--) Ra(s) 
(catraso 0). 


Na Figura 2.6, mostram-se as respostas temporais obtidas aproximando 
o atraso puro de tempo por Ri(s), Ro(s) e Ra(s). D 


Em simulações efetuadas no domínio do tempo, por exemplo, usando-se 
equações diferenciais e rotinas de integração numérica, atrasos de tempo 
podem ser simulados usando-se filas do tipo FIFO (fist in, first out). Neste 
caso, o tamanho da pilha é diretamente proporcional ao atraso de tempo e 
inversamente proporcional ao intervalo de integração usado. 
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2,4 Resposta em Fregiiência 


O objetivo de se estudar a resposta em fregiiência de um sistema é verificar 
como tal sistema responde a um sinal senoidal de fregiiência w. 

No capítulo anterior foi visto que um sistema é linear se satisfaz o prin- 
cípio da superposição. Uma importante consegiiência da linearidade em 
sistemas será determinada a seguir. 

Seja um sistema linear com função de transferência H(s) excitado por 
uma senóide u(t) = sen(wt) cuja transformada de Laplace da entrada é 
Llult)) = U(s) = w/(s? + w?). A resposta em regime permanente de H(s) 
é a transformada inversa de Laplace de H(s)U(s), ou seja, 


J Je 
Li (H(s)U(s 0 [8 l - : : 
(E(U(s)) Oia ts (2.23) 
sendo que J é o resíduo no pólo em s = —jw e o asterisco indica o conju- 
gado complexo. Na equação acima, os termos dentro dos colchetes são os 
elementos da decomposição em frações parciais da transformada de Laplace 
da entrada U(s). Por definição, os resíduos nos pólos s = =jtw são: 


w . 
asa era et 
Hi) = dit, 
H(ju) 

EE 


s=-jw 


] 


y 


sendo que s foi substituído por jw na expressão de J*. A resposta em 
fregiiência do sistema, H'(jw), é um número complexo e, portanto, pode ser 
expresso em termos de seu módulo e fase. Uma possível representação é 


H 


H(jw) 
H(-ju) 


[H(jw)| e?º, 
[H(-ju)| e? =| H(ju)| e. (2.24) 


Por outro lado, a resposta temporal do sistema acima é 


u(t) = Je it p tt 4 et +. + Jr, (2.25) 


sendo que os J; são os resíduos correspondentes aos pólos p;. Os dois primei- 
ros termos à direita do sinal de igualdade correspondem à entrada (solução 
particular), e os demais termos correspondem ao próprio sistema (solução 
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homogênea). Na Eq. 2.25 foi assumido que H(s) só tem pólos reais de multi- 
plicidade igual à um. Se H(s) tivesse pólos complexos conjugados ou pólos 
repetidos, y(t) seria composto conforme mostrado na Seção 2.2 mas, ainda 
assim, à análise da presente seção permanece inalterada. 

Observa-se que, se o sistema for assintoticamente estável (ou seja, p; < 
0,1 =1,...,n), à contribuição dos termos correspondentes à solução ho- 
mogênea tende a zero. Logo, em regime permanente, a saída do sistema 
será apenas 


u(t) = Jeriut + gtedut, (2.26) 


que é a representação de Euler de uma senóide. Portanto, a resposta de 
um sistema linear assintoticamente estável em regime permanente a uma 
entrada senoidal é também senoidal. Deve ser notado que esse resultado 
independe do sistema ter todos os pólos reais, como suposto acima. Evi- 
dentemente, se o sistema tiver pólos complexos conjugados ou pólos de 
multiplicidade maior do que um, a Eq. 2.25 terá outra forma. Entretanto, 
desde que o sistema seja assintoticamente estável, em regime permanente, 
a observação acima continua válida. 

A fim de investigar com mais detalhes as características da resposta 
senoidal do sistema, será vantajoso substituir na Eq. 2.26 as definições dos 
resíduos. Portanto, 


H(juw) ju H(-jw) ju 
8) = Elin TIO ju 
u(t) 27 e % e 
= 1eiGi) [ei ju 1H (Gu) [ecit 
23 25 
— elut+6) — e-ilwt+o) 
= |H(jw)| 
J 
= |H(jw) |sen(wt + 6). (2.27) 


eriut 


A última equação permite tecer alguns comentários mais profundos 
quanto à resposta senoidal do sistema. Em particular, vale a pena ressaltar 
que quando um sistema linear e assintoticamente estável é excitado por uma 
senóide de fregiiência w, em regime permanente, sua resposta também será 
uma senóide de fregiiência w, mas com sua amplitude e fase possivelmente 
alteradas. Além disso, a mudança na amplitude e na fase não é fixa, mas 
depende das características dinâmicas do sistema e da freqiiência do sinal 
de entrada, w. 

Portanto, a interpretação da Eq. 2.27 é que a resposta de um sistema 
linear assintoticamente estável a uma excitação senoidal é também senoidal 
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de mesma frequência. A amplitude da resposta é igual à amplitude da 
entrada multiplicada pelo módulo da resposta em freqiiência do sistema na 
frequência de excitação. Semelhantemente, o sinal de saída estará defasado 
do sinal de entrada de um valor igual à fase da resposta em frequência do 
sistema na freqiiência da excitação, 

A consegiiência dessa propriedade é que o sistema responde de forma 
diferente a sinais de frequências diferentes. Para cada fregiiência de excita- 
ção, o sistema amplificará (ou atenuará) o sinal e o defasará com relação à 
entrada. A amplificação (ou atenuação) e a defasagem dependem, respec- 
tivamente, do ganho e fase da resposta em frequência. Essa informação é 
representada de forma concisa no diagrama de Bode. Outras maneiras de 
representar a mesma informação são os diagramas de Nyquist e Nichols. 


Exemplo 2.4.1. Resposta em fregiência desistema com dominância modal 


A resposta em frequência de H(jw) em (2.11) é mostrada na Figura 2.7. 


=120' — 4 — 
% o so! 
ca(radis) 


FIGURA 2.7: Exemplo de resposta em frequência 


Resposta em fregiiência de H(jw) em (2.11). O diagrama superior 
mostra o ganho, e o inferior, a fase. Note como a ressonância em 
torno de 0,27 Hz, devida aos pólos lentos, é relativamente pequena 


(ex22 0). 


É interessante observar na Figura 2.7 que os pólos mais lentos têm menor 
importância na resposta total do sistema. Pode ser constatado que excitan- 
do H(s) com u(t) = sen(270,9t), em regime permanente, a resposta será 
aproximadamente y(t) = 1,2sen(270,9t — 1/3) (ver Exercício 2.10). [| 
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H(jw) pode ser escrita na forma polar H(jw) = |H(jw) |e??, sendo que 
|H(jw) | é o ganho, amplitude ou ainda o valor absoluto de H(jw) e pé a 


sua fase, dada por 
= tanmt J Im[H(gw)] 
g=tan (ii ) R (2.28) 


Portanto, a resposta em fregiiência de um ganho puro, K, tem amplitude 
2010g K dB e fase O graus, para qualquer fregiência. Em outras palavras, 
um ganho puro transfere igualmente para a saída todas as frequências da 
entrada e sem defasagem. Assim, o ganho puro é um elemento estático, sem 
dinâmica. 

Fazendo a análise da resposta em frequência, a amplitude de 1/jw é 
201og |1/jw|= —2010gw dB e a fase é 6 = tan”!(-00) = —90º. Ou seja, a 
amplitude é uma reta com inclinação -20 dB/década, quando representada 
em escala logarítmica. Em geral, a resposta em fregiiência de um integrador 
de multiplicidade p, 1/(jtw)!!, terá uma amplitude de —y x 20 log w dB e fase 
4 =-ux90º. 

A resposta em fregiiência de jw tem amplitude 20 log |jw E 20 log w dB 
e fase 4 = tan” 100) = 90º. Neste caso, o ganho é uma reta com inclinação 
20dB/década, quando representado em escala logarítmica. Em geral, a 
resposta em fregiiência de um derivador puro de multiplicidade p,, (juw)!, 
terá uma amplitude de yu x 20l0g w dB e fase é = u x 90º. 

As respostas em fregiiência dos elementos K = 1, 1/jw e jw são mos- 
tradas na Figura 2.8. 


2.4.1 Funções de transferência de primeira ordem 


Para obter a resposta em fregiência da função de H(s) = K/(rs + 1), será 
conveniente expressar tal função como 


, K 
Hu) = Ta jur 
O módulo dessa função é 
: K - jurK 
20l0g | H(jw) | = 20l0g Truid 
Kº (Kwr)? 
= 20log Try + Truta 
, K 
= Wlog —==>= 
es Vl +uwlr? 


20l0g K — 2010g V1 + w272 dB. 


H 
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10! ot no! 
espada) 


FIGURA 2.8: Resposta em frequência de K = 1, 1/jw e jw 
(=) K=1,(+-) 1/jw e (+=) jus (a) ganho, e (b) fase (abaco O). 


Para baixas freqiiências, w « 1/7 e | +wlr? x 1, logo 


20log | H(jw) |= 2010g K —- 2010g Vi = 2010g K dB. 


Para altas frequências, w > 1/7 e 1 + w?r? x w?r?, o que resulta em 


2010g | H(juw) | 2010g K — 2010g Vw?r? 


= 20log K — 20log wr dB. 


A última expressão é composta de dois termos. O primeiro termo é 
constante e o segundo termo decresce 20dB para cada década de w. Por 
isso, representando o segundo termo numa escala logarítmica com respeito 
à fregiiência, o resultado é uma reta com inclinação -20 dB/década. 

Portanto, a resposta em fregiiência de um sistema de primeira ordem 
pode ser aprozimada por duas assíntotas. Uma aproxima a resposta do 
sistema a excitações de baixa freqiiência, e a outra a altas frequências. Tais 
assíntotas encontram-se na frequência w = 1/7, que é chamada de fregiiência 
de corte ou fregiiência de canto (ver Exercício 2.8). 

O ângulo de fase é dado por (2.28), o que para o sistema de primeira 
ordem em questão resulta em 


= -tan"lur. 
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Esta função assume os valores 0º, -45º e -90º para as fregiiências 0, 1/7 
e 09, respectivamente. As relações acima são ilustradas na Figura 2.9 para 
sistemas de primeira ordem do tipo H(s) = 1/(7s + 1), para vários valores 
do parâmetro 7. 


e 


a Tor 10º 1 
do (radis) 


FIGURA 2.9: Resposta em fregiência de H(jw) = 1/(rjw + 1) 


Resposta em frequência de H(s) = 1/(rjw+1), para vários valores 
do parâmetro 7. (a) ganho, e (b) fase (abaco O), 


Exemplo 2.4.2. Resposta em fregiiência de (1 + jwr) 


Seguindo-se o mesmo procedimento acima, é fácil verificar que o ganho 
de um termo do tipo (1+jwr) é 20l0g V1 + w2r2. Portanto, o módulo desse 
termo pode ser aproximado por duas assíntotas, uma para baixas frequên- 
cias em 0dB e uma para altas freqiiências com inclinação 20 dB/década. 
Tais assíntotas se cruzam na freqiência de canto w = 1/7, conforme pode 
ser notado na Figura 2.10. 

A fase do termo (1 + jwr) é 4 = tan" lwr. Portanto, a fase terá valores 
0º, 45º e 90º para as frequências 0, 1/7 e oo, respectivamente. o 


2.4.2 Funções de transferência de segunda ordem 


A fim de analisar a resposta em frequência, a função de transferência (2.16) 
será reescrita como 
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H(jw) = E O 
10) = Tr Rafa) + Gulf)? di 
ta) 
“o e pm = 


do (radio) E 


FIGURA 2.10: Resposta em fregiência de 7jw + 1 


Resposta em frequência de 7jw + 1, para vários valores do parã- 
metro 7. (a) ganho, e (b) fase (abaco (0) 


Seguindo-se os mesmos passos dados na análise de sistemas de primeira 
ordem, pode ser verificado que o módulo de (2.29) é 


201og | H(jw) |= —2010g (1 — w2/w2)? + (2Cw [wn)? dB. 
Para baixas fregiências (w « wn), tem-se 
201og | H(jw) |= -2010g 1 = 0dB. 
Para altas fregiências (w > wn), tem-se 
2010g | H(jw) |= —2010g w? /wê = —40 log w/wn dB. 


Como para o caso de sistemas de primeira ordem, a última expressão 
decresce 40 dB para cada década de w. Quando representada numa escala 
logarítmica para a fregiência normalizada w/wn, a função —40 log w /wn dB 
é uma reta com inclinação —40 dB /década. 
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A resposta em freqiiência de um sistema de segunda ordem também pode 
ser aprovimada por duas assíntotas. Uma aproxima a resposta do sistema a 
excitações de baixa fregiiência e a outra a altas frequências, e se encontram 
em w =. Nessa fregiiência —40 log w/wn = —4010g1 = 0dB. Portanto, 
wn é à frequência de canto do sistema de segunda ordem. Entretanto, tal 
aproximação não é muito precisa em torno de w = wn para sistemas pouco 
amortecidos (€ < 1). Finalmente, o ângulo de fase de um sistema de 
segunda ordem com pólos complexos conjugados é dado por 


6 = tan! (eles) ; 


1-w2?/w? 


Tal função assume os valores 0, —90º e —180º para as seguintes freqiiên- 
cias 0, 1/7 e oo, respectivamente. A Figura 2.11 ilustra a resposta em 
freqiiência para sistemas de segunda ordem do tipo (2.29), para vários va- 
lores do quociente de amortecimento (. 


(o) 
o 
É (0,1 
-s0 1 
2.10 
8 
ER 
-200! 
10" 10º so! 
corados) 


FIGURA 2.11: Resposta em fregiiência de sistema de segunda ordem 


Resposta em fregiiência de (2.29), para diversos valores do 
quociente de amortecimento (. (a) ganho, e (b) fase (abaco 0). 


2.4.3 Funções de transferência com atraso puro de tempo 


A resposta em fregiiência do atraso puro de tempo pode ser obtida facil- 
mente lembrando que, por definição, e=7a* representa uma grandeza que é 
complexa com módulo unitário e com ângulo de fase igual a —wra. 
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A Figura 2.12 mostra a resposta em fregiiência do atraso puro de tempo, 
bem como das aproximações de primeira, segunda e terceira ordens obtidas 
no Exemplo 2.3.3, Deve ser notado que a fase do atraso puro de tempo 
não satura para fregiiências elevadas. Essa característica resulta num efeito 
desestabilizador quando o sistema opera em malha fechada. 


(a) 


1 — 


gr 1º 10 
vo (radis) 


FIGURA 2.12: Resposta em fregiiência de atraso puro de tempo 


Resposta em fregiiência de (—) ei“ e das aproximações de pri- 
meira, segunda e terceira ordem (:-*) Ri(jw), (— :—) Ro(jw) e 
(- -) Ra(juw), respectivamente. (a) ganho, e (b) fase (catraso O). 


Finalmente, deve ser notado que tanto a resposta temporal quanto a 
resposta em frequência de sistemas de mais alta ordem podem ser obtidos 
usando-se a análise deste capítulo e aplicando-se o princípio da superposição. 


2.5 Representação no Espaço de Estados 


Na Seção 2.2 foi apresentado o conceito de função de transferência. Uma 
das características básicas dessa representação é que ela descreve a dinâmica 
entre duas (ou mais de duas, no caso multivariável) variáveis, denominadas 
entrada e saída. Em outras palavras, uma função de transferência descreve 
a relação dinâmica de causa e efeito entre uma entrada e uma saída de 
um determinado sistema. Consequentemente, a função de transferência não 
fornece informação detalhada sobre o que acontece dentro do sistema, entre 
o ponto de entrada e o ponto de saída. 


á 
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Uma representação que pode ser usada para modelar também relações 
entre variáveis internas ao sistema é a representação em espaço de estados, 
mencionada na Seção 1.2.3. Esse tipo de representação descreve o sistema 
no domínio do tempo e é mais conveniente para representar sistemas não- 
lincares e multivariáveis do que a função ou matriz de transferência. Um 
modelo linear típico em espaço de estados tem a seguinte forma: 


x = Ax+Bu 
y Cx + Du, (2.30) 


sendo que x E IR” é o vetor de estado n-dimensional, o ponto indica a 
derivada temporal, ou seja, X = dx/dt; u(t) E IR” é o vetor de entradas 
formado por r funções temporais; y(t) E IR” é o vetor m-dimensional de 
saídas medidas e 4, B, C e D são matrizes constantes. O modelo (2.30) 
será multivariável se r > 1 e/ou m > 1. Se houver apenas uma entrada 
r = 1 e uma saída m = 1, o modelo é dito monovariável. 

Duas observações importantes sobre a representação em espaço de es- 
tados são: i) o conhecimento do vetor de estado em qualquer instante tg 
especifica o estado ou condição do sistema nesse instante; ii) a represen- 
tação em espaço de estados não é única. Ou seja, é possível representar o 
mesmo sistema com mais de um modelo no espaço de estados. 

Uma vez que (2.30) relaciona as variáveis de entrada e saída, é natural 
se perguntar como fazer para obter a função de transferência a partir da 
representação em espaço de estados, como ilustrado no próximo exemplo. 


Exemplo 2.5.1. Função de transferência a partir do espaço de estados 


O procedimento para representar o modelo (2.30) como uma função de 
transferência é muito simples. Basta para isso lembrar que a função de 
transferência relaciona as transformadas de Laplace da saída e da entrada 
do sistema. Assim, aplicando a transformada de Laplace ao modelo (2.30), 


tem-se 
X(s)s 
Y(s) 


AX(s) + BU(s) 
CX(s) + DU(s), (2.31) 


sendo X(s) = L(x), Y(s) = L(y) e U(s) = L(u). Manipulando a primeira 
equação de (2.31), tem-se 


(Is — A) X(s) BU(s) 
x(s) = (1s5— A)! BU(s), (2.32) 
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e substituindo-se esse resultado na segunda equação de (2.31), chega-se a 


Y(s) = C(Is- A)! BU(s) + DU(s) 


To) CUs-AJ!B+D. (2.33) 


u 


Em modelos de sistemas reais D = 0 em praticamente todos os ca- 
sos, Deve ser notado que se o sistema for multivariável Y(s)/U(s) não será 
apenas a razão entre dois polinômios em s, mas poderá ser representada 
como a razão entre polinômios de matrizes em s. A representação de mo- 
delos multivariáveis usando-se matrizes de transferência é um assunto de 
maior complexidade. De forma geral, a representação em espaço de estado 
é preferida na modelagem de sistemas multivariáveis. [8] 


Um resultado muito importante relacionado ao Exemplo 2.5.1 é o se- 
guinte, Seja a função de transferência 


H(s)=C(1s= AJ! DB. 


Cada pólo de H(s) é um autovalor da matriz A. 

A Eq. 2.30 mostra que o modelo em espaço de estados não apenas tem 
informação sobre a relação entrada-saída, mas também informação “inter- 
na”, que são as próprias variáveis de estado. Isso é ilustrado no próximo 
exemplo. 


Exemplo 2.5.2. Representação em espaço de estados de um circuito 


Considere o circuito modelado no Exemplo 2.2.1. Observando as Eqs. 2.1 
e 2.2 e lembrando que a representação em espaço de estados tem a forma 
geral x = f(x,u(t)), percebe-se que as equações em espaço de estado são 
di(t) 1 k 
E (=Ri(t) — ve(t) + v(8)) 
dvelt) it) 
d o C 


(2.34) 
e que podem ser representadas em forma matricial como se segue: 


[ig] = [E Sa) Li)oo 
| ( 


x = Ax+Bu. 2.35) 


a 
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A segunda equação em (2.30) é chamada de equação de saída, pois ela 
compõe a saída do sistema y como uma combinação linear (definida pela 
matriz O) das variáveis de estado. Obviamente, fazendo-se a escolha O = I, 
o vetor de saída torna-se igual ao vetor de variáveis de estado. Procedendo 
dessa forma, tem-se a seguinte equação de saída: 


[86] = [6 7]-[643] 
y = O (2.36) 


Comparando a representação em espaço de estados desenvolvida neste 
exemplo com a função de transferência (2.4), observa-se que esta só modela 
a relação entre I(s) e V(s), ao passo que o modelo em espaço de estados 
tanto tem informação dinâmica de i(t), quanto de vc(t) para a entrada v(t). 

õ 


Conforme mencionado anteriormente, uma representação em espaço de 
estados não é única, no sentido de que há diversas maneiras de representar 
o mesmo sistema no espaço de estados. Na Seção 2.2.2 foi apresentada a 
decomposição em frações parciais de funções de transferência que, como vis- 
to, é caracterizada pelo desacoplamento dos diversos modos de um sistema. 
A representação análoga no espaço de estados é a representação de Jordan 
que, para um sistema monovariável de n-ésima ordem com autovalores reais 
e distintos (A ... An), tem as seguintes matrizes: 


A = diagh...M]; 
Bi = lb: ... ba)”; 
Cr == [ejss»ón): 


Existem outras representações canônicas tais como a forma companhei- 
ra controlável e a forma companheira observável. É possível passar de uma 
representação para a outra utilizando transformações de similaridade. Pa- 
ra detalhes, o leitor pode consultar o capítulo escrito por (PEREIRA DA 
SILVA, 2007) especificamente sobre esse assunto, ou os livros recomendados 
na Seção Leitura Recomendada, ao final deste capítulo. 

Antes de encerrar esta seção, será considerado o caso discreto. A repre- 
sentação em espaço de estados de um sistema discreto é 


HI 


x(k +1) Ox(k) + Tu(k) 
y(k) = Hx(k), (2.37) 
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sendo que x(k) € IR” é o vetor de estado n-dimensional no instante k, 
u(k) € IR” é o vetor de entradas no instante k formado por r funções 
temporais; y(k) € IR” é o vetor m-dimensional de saídas no instante ke 
6, Te H são matrizes constantes de dimensões adequadas. Por simplicidade 
considerou-se que não existem conexões diretas entre a entrada e a saída 
(portanto, D = 0). 

Aplicando-se a definição de transformada Z, tem-se 


X(2) = Soxtb)o* 
k=0 
Z(edk+1)) = Dox(h+I)z* 
k=0 


= x(1)+x(2)2! +x(3)22 +... 
= 25 x(h)zt = zx(0) 

0 
= 2X(2) - 2x(0). 


Portanto, pode-se escrever 


Y(z) = H(z1 - 6) !TU(2) + He(2] — d)-Ix(0). 


Como a função de transferência é calculada para condições iniciais nulas, 
tem-se, finalmente, 
Y(z) f. = 
H(2)= Va) — H(zl- 6)-r, (2.38) 
que é o análogo discreto de (2.33). 
No Complemento 2.1 discutem-se formas de passar da representação de 
tempo contínuo para a de tempo discreto e vice-versa. 


2.6 Representações em Tempo Discreto 


Nas seções anteriores do presente capítulo foram apresentadas algumas 
representações tais como funções de transferência e modelos em espaço 
de estados. Como ficará claro em capítulos posteriores, existem algumas 
representações matemáticas que são especialmente adequadas à identifica- 
ção de sistemas usando-se algoritmos conhecidos para a estimação de parâ- 
metros. O objetivo da presente seção é apresentar, de forma generalizada, 
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algumas representações que serão bastante úteis ao longo do livro. Obvi- 
amente, algumas de tais representações estão fortemente relacionadas às 
representações já vistas. 

Considere o seguinte modelo geral: 


Alouto) = Fogult) + SD), (2.39) 
Bo. C(a) 
“= AU + Diga 


vlk) = H(a)u(k) + G(a)v(k), 


sendo q”! o operador de atraso, de forma que y(k)q”! = y(k—1), v(k) ruído 
branco e A(q), B(q), C(q), D(a) e F(g) os polinômios definidos a seguir: 


A(g) = 1-aq!-..- angry 

B(g) = big! +... tda"; 

Cla) = 1+ag!+...teng” 

Da) = 1dig! +... + dns; 

F(g) = A+ fig t+... + fg". (2.40) 


As funções H(q) e G(q) normalmente são referidas com as funções de 
transferência do processo e do ruído, respectivamente. Ou seja, H(q) é o 
resultado de subtituir q = z ? na transformada unilateral Z da resposta ao 
impulso do processo, h(k). Alguns autores preferem representar a resposta 
ao impulso do processo por g(k) e, nesse caso, as funções de transferência 
do processo e ruído são G(q) e H(q), respectivamente. 


2.6.1 Modelo de resposta ao impulso finita 


O somatório de convolução entre a resposta ao impulso, h(k), de um sistema 
e um sinal de entrada u(k) resulta na saída do sistema com ruído e(k), 
conforme vê-se a seguir: 


[ad 
ul) =. hli)u(k — 5) + elh). (2.41) 

j=0 
“Essa substituição se faz necessário uma vez que, a rigor, H(z) é uma representação 
no domínio da fregiiência, ao passo que H(q) é uma representação no domínio do 
tempo, Assim, todas as entidades em (2.39) estão no domínio do tempo. Além disso, 
q”! éo operador de atraso, ao passo que z7!, a rigor, não é um operador, mas é o 

inverso de uma variável complexa. 
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A Eq. 2.41 é também conhecida como o modelo de resposta ao impulso 
infinita (LIR do inglês infinite impulse response). O modelo FIR (do in- 
glês finite impulse response) pode ser obtido a partir de (2.39), tomando-se 
C(a) = D(a) = F(a) = A(g)=1 e B(a) 41. 

Uma característica de modelos FIR é que são de natureza não-recursiva, 
ao passo que os modelos IIR são de natureza recursiva. Portanto, em geral, 
equações de diferenças com variáveis y(k — à) e u(k — 5) do lado direito da 
igualdade são modelos IIR. Pensando em termos de função de transferência, 
pode-se dizer que sistemas cujos modelos são do tipo IIR têm funções de 
transferência racionais, ao passo que para sistemas cujos modelos são FIR, 
as respectivas funções de transferência são polinomiais. 

Um processo MA, y(k) = C(q)v(k), é um exemplo de modelo FIR, bem 
como um sistema que só tenha zeros: y(k) = B(a)u(k) (note a relação 
polinomial entre y(k) e as demais variáveis). Por outro lado, um modelo 
ARX, A(g)y(k) = B(g)u(k), é do tipo IR, pois a presença de A(q) implicará 
recursividade, como pode ser constatado pelo fato da respectiva função de 
transferência, Z(B(q))/Z(A(q)), ser racional. 

Se H(q) for assintoticamente estável, então existe M < 00, de forma 
que h(k) = 0, Vk > M (ver Exercício 3.9). Portanto, truncando a equação 
(2.41) resulta no modelo de resposta ao impulso finita (FIR) 


M 
uk) = 55 hlj)u(k — 5) + e(k). (2.42) 
A 


O modelo FIR pode ser obtido a partir de (2.39), tomando-se 
A(a) = C(q) = D(g) = F(q) = 1 e B(q) um polinômio arbitrário de ordem 
M, ou seja, ny = M. Nesse caso, o modelo FIR (2.42) pode ser reescrito 
como 


v(k) = B(a)u(k) + v(k) (2.43) 


e pode ser representado esquematicamente conforme visto na Figura 2.13. 
Deve ser notado que, como C(g)/D(g) = 1, então o ruído acrescentado na 
saída y(k), e(k), é branco. Portanto, no presente caso e(k) = v(k). 


2.6.2 Modelo ARX 


O modelo auto-regressivo com entradas externas (ARX do inglês autore- 
gressive with ezogenous inputs) pode ser obtido a partir do modelo geral 
(2.39), tomando-se C(q) = D(q) = F(q) = 1 sendo A(q) e B(g) polinômios 
arbitrários, resultando em 
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AMa)y(k) = Bla)u(k) + v(k). (2.44) 


e(k)=v(k) 


k + 
Ml dia) vb) 
+ 


FIGURA 2.13: Representação esquemática de modelo FIR 
O ruído é acrescido diretamente à saída, nesse sentido trata-se 
de um modelo do tipo erro na saída. Por outro lado, tanto a 
função de transferência do processo B(q) quanto a do ruído têm 
o polinômio A(q) = 1 por fator comum. Nesse sentido o modelo 
FIR também é do tipo erro na equação. 


Uma vez que o ruído v(k) aparece diretamente na equação, o modelo 
ARX é normalmente classificado como pertencendo à classe de modelos de 
erro na equação. O modelo (2.44) pode ser reescrito da seguinte forma: 


v(t) = aut + rt) (2.45) 


o que coloca em evidência as funções de transferência do sistema 
H(g) = B(q)/A(a) e de ruído C(g)/[D(q) A(q)] = 1/A(q), conforme pode 
ser apreciado na Figura 2.14. 

Ao contrário do modelo FIR, o ruído que aparece adicionado à saída, 
e(k) = v(k)/A(q), não é branco. Ou seja, nesta representação o ruído é 
modelado como um processo branco filtrado por um filtro auto-regressivo, 
com pólos idênticos aos do processo, que são as raízes do polinômio A(q). 


Exemplo 2.6.1. Modelo AR para um sistema fisiológico * 


Se uma pessoa normal esticar o braço, a sua mão não ficará perfeita- 
mente estática. Pelo contrário, haverá um movimento oscilatório conhecido 
como tremor, que pode ser representado por um modelo AR, excitado por 
ruído branco. 

Foi observado que o braço humano esticado comporta-se como um osci- 
lador amortecido, excitado por atividade muscular não correlacionada (con- 
ceito que será estudado no Capítulo 4). Além disso, o espectro do sinal de 
tremor não revela harmônicas de mais alta ordem, o que indica que o sistema 
é basicamente linear. O tremor de mão pode ser modelado por 


“Timer, 1998. 
“Essa conclusão pode ser tirada, lembrando que o efeito de não-linearidades sobre 
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v(k) = my(k — 1) + azy(k — 2) + v(k), 


q 2cos (7) 
-1 -2 
exp E ag exp Ea , 


e v(k) é ruído gaussiano com média zero e variância unitária. T' = 40 é 
o período característico e 7 = 91 é o tempo de relaxação. A unidade em 
ambos os casos é intervalos de amostragem, que é igual a Ts = 1/300s, ou 
seja, Tx 03seT x 13s. [ml 


sendo 


] 


(k) 
- O 
() 
v(k) 
At V A pa 


ste ss) B 
(a) O o 


FIGURA 2.14: Representação esquemática de modelo ARX 


A representação em (a) é equivalente à Eq. 2.45, que, após algumas 
manipulações, pode ser representada na forma indicada em (b). 
Do esquema em (b) fica claro que o erro não aparece na saída. As 
funções de transferência do processo e de ruído têm o polinômio 
A(q) como fator comum, ver esquema em (a). 


componentes de freqiência é, muitas vezes, o de somá-las ou mesmo multiplicá-las, 
como no caso da modulação em amplitude. 
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2.6.3 Modelo ARMAX 


O modelo auto-regressivo com média móvel e entradas exógenas (ARMAX 
do inglês autoregressive moving average twith exogenous inputs) pode ser 
obtido a partir do modelo geral (2.39), tomando-se D(g) = F(g) = 1 
A(a), B(q) e C(a) polinômios arbitrários, resultando em 


Aa)y(k) = Bla)u(k) + Cla)v(k); (2.46) 
ou, alternativamente, 


Cla) 


vb) = aut) + To 
vlk) = H(g)u(k) + e(k), (2.47) 


sendo e(k) não branco, conforme pode ser constatado na Figura 2.15a. 


a ly 
4(9) 


FIGURA 2.15: Representação esquemática de modelo ARMAX 


A representação em (a) é equivalente à Eq. 2.47, que, após algumas 
manipulações, pode ser representada na forma indicada em (b). 


À semelhança do modelo ARX, o modelo ARMAX pertence à classe de 
modelos de erro na equação. No presente caso o erro na equação é modelado 
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como um processo de média móvel (MA), e o ruído adicionado à saída, e(k), 
é modelado como ruído branco filtrado pelo filtro ARMA, C(q)/A(q). Por 
outro lado, se em um modelo ARMAX A(g) = C(q) = F(q), tal modelo 
pode ser representado como um modelo de erro na saída, como será visto 
na Seção 2.6.5. 


2.6.4 Modelo ARMA 


O modelo ARMA é um caso particular do modelo ARMAX, quando não 
há sinais exógenos, ou seja, quando u(k) = 0. Nesse caso (2.46) pode ser 
reescrito como 


A(a)y(k) = C(a)v(k), (2.48) 
ou, alternativamente, 

ui) = So) 

ulk) = Glau(k), (2.49) 


sendo G(q) a função de transferência do ruído, ou seja, ela quantifica como 
o processo aleatório branco v(k) afeta a saída y(k). 

Foi dito que um modelo ARMA não tem entradas externas. De certa 
forma isso é verdadeiro, pois tomou-se u(k) = 0, mas, por outro lado, é 
possível interpretar o processo aleatório v(k) como a entrada do sistema. 
Nesse caso interpreta-se a saída y(k) como uma versão filtrada da “entrada” 
v(k) usando-se o filtro G(q). Modelos ARMA são comumente usados como 
modelos de séries temporais, ou seja, situações em que somente se tem 
um sinal, y(k). Nesses casos, estima-se G(q) usando-se tal sinal e mais 
uma realização de v(k) tomada de uma distribuição de probabilidade ou 
utilizam-se os próprios resíduos £(k) do modelo estimado” no lugar de v(k). 

Fregiientemente indica-se um modelo ARMA com polinômios A(g) e 
C(q) com ordens p e q, respectivamente, por ARMA(p,9). Usando-se a 
nomenclatura definida em (2.40), um modelo ARMA(p,9) corresponde a 
ARMA(nyny). 


2.6.5 Modelos de erro na saída 


Modelos do tipo erro na saída são modelos que podem ser escritos na forma 
da Eq. 2.39, mas com o polinômio A(g) = 1.7 Um exemplo simples pode 


Os resíduos de um modelo estimado serão definidos no Capítulo 5. 

7 Alternativamente, pode-se dizer que modelos do tipo erro na equação são aqueles em 
que as funções de transferência do processo e do ruído têm o polinômio A(q) como 
fator comum. 
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ser obtido a partir do modelo geral (2.39), tomando-se A(g) = C(g) = 1, 
D(a) = 1, B(a) e F(a) polinômios arbitrários, o que resulta em 


vh) = FO u(k) + v(k), (2.50) 
sendo que o fato do ruído branco 1(k) ser diretamente adicionado à saída 
justifica o nome desta classe de modelos. 

É importante observar a diferença que existe entre a representação (2.50) 
e a representação ARX em (2.44). Para ver a diferença, basta tentar repre- 
sentar (2.50) como um modelo ARX. Ao se fazer isso chega-se a 


F(a)u(k) 
vík) 


Blau(k) 
vu(k) + v(k), 


em que w(k) é uma variável auxiliar sem ruído, que não é medida. Assim, 
a saída y(k) do modelo (2.50) pode ser interpretado como a superposição 
de ruído branco com um processo ARX sem ruído, como ilustrado na Figu- 
ra 2.16. 


v(k) 
u(k) B(q) |wK)X+ 
==) =. »(k) 
F(g) | + 


FIGURA 2.16: Representação esquemática de modelo de erro na saída 


O ruído branco v(k) é acrescido à saída. O modelo FIR é um caso 
particular deste modelo para o caso em que F(g) = 1. 


2.6.6 Modelo Box-Jenkins 


O modelo de Box-Jenkins pode ser obtido a partir do modelo geral (2.39) 
tomando-se A(q) = 1 e os demais polinômios arbitrários, resultando em 
(Box; JENKINS, 1970) 


B(a), Cla) 
Pág) “8 + Da)”: 


Como no caso dos modelos de erro na saída, nos modelos Box-Jenkins as 
funções de transferência do sistema B(q)/F(q) e do ruído C(q)/D(q) não 
têm parâmetros comuns, ou seja, são independentemente parametrizadas. 
O modelo Box-Jenkins também é do tipo erro na sta; conforme pode ser 
visto na Figura 2.17. 


y(k) = 7u(k) + 7 
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uh | B(9) 
F(a) 


FIGURA 2.17: Representação esquemática de modelo Box-Jenkins 


Apesar de ser parecido com a representação ARMAX, não é pos- 
sível se fazer a manipulação de blocos feita na Figura 2.15b pelo 
fato das funções de transferência do processo e do ruído não te- 
rem um fator comum no denominador. O modelo Box-Jenkins, 
portanto, é do tipo erro na saída. 


2.7 Complementos 


Complemento 2.1. Mapeamentos H(z) +» H(s) 


Em diversas situações é de interesse ser capaz de obter uma função de 
transferência discreta a partir de uma contínua, ou vice-versa. No presente 
complemento, serão apresentados algumas formas de “mapear” funções no 
domínio s para o dimínio z e vice-versa. As transformações s — z são 
baseadas em aproximações discretas para a derivada. Algumas delas são 


z-1 z-1 2(2-1) 


Ee— =— —— 
$ T, , 8 ºC T+) 


(2.51) 
sendo denominadas, respectivamente, aproximação ezplícita de Euler, apro- 
ximação implícita de Euler e método de Tustin ou transformação bilinear. 
A nomenclatura s + « significa que s deve ser substituído por x. Às 
relações necessárias para mapear funções de transferência discretas em con- 
tínuas podem ser otidas diretamente a partir de (2.51), explicitando z de 
forma a se obter 


1+(7,/2)s 


—— , 26 —— O. 
28 lho to qTo! * 1= (5/2) 


(2.52) 


Deve ser observado que, apesar de simples, os mapeamentos (2.51) e 
(2.52) são trabalhosos e numericamente malcondicionados. Recomenda-se 
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usar grande número de casas decimais sempre que (2.51) ou (2.52) forem 


usados para obter modelos. 


Complemento 2.2, Modelo ARX multivariável 


Considere-se um modelo com p saídas e r entradas. Nesse caso, uma 
possível realização multivariável de um modelo ARX é (compare com (2.44)) 


y(k) = +Ay(k-1)...+ AnyY(k — ny) 
+Biu(k — 1)... + Bn,u(k — ny) + e(k), (2.53) 


sendo A; E IRPXP, B; E IRPX” e 


v(k) = [on(k) ga(k) +. uplk)] 
u(t) = [u(k) uz(k) ... uk) 
e(k) = [e(k) ea(k) ... ep(k)J". 


De forma análoga aos polinômios A(q) e B(q) em (2.44), podem ser 
definidas matrizes de polinômios, ou seja, matrizes em que cada elemento é 
um polinômio (compare com (2.40)) 


A(a) 
B(q) 


I-Ag!-...- Ang"; 
Big! +...+ Brg". 


A descrição detalhada sobre a representação de sistemas multivariáveis 
usando-se matrizes de polinômios pode ser encontrada em (KAILATH, 1980). 
A representação multivariável acima mencionada é conhecida como modelo 
VARX (do inglês vector autoregressive model with exogenous inputs). Pa- 
ra ilustrar esse tipo de modelo considere o seguinte exemplo (ver Exercí- 
cio 2.14)? 


[28] = [08 3) e8c3]+[0m cs) pcs 


+ i)lGaco eso 


SLJUNG, 1987. p. 80. 
“BAGARINAO; SATO, 2002. p. 264. 
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Deve ser notado que tal representação usa o mesmo conjunto de variáveis 
regressoras para explicar cada elemento do vetor de saída y(k) ao custo de 
um aumento no número de parâmetros. Uma alternativa será discutída à 
seguir, e também no Complemento 10.1, em que cada elemento do vetor 
y(k) pode ser explicado por um conjunto distinto de variáveis regressoras, 
Esses modelos são chamados de MIMO (do inglês multi-input, multi-output), 
Evidentemente, tanto os modelos VARX quanto MIMO são multivariáveis, 

Como será visto nos próximos parágrafos, a realização mínima de siste. 
mas multivariáveis não é única. Ou seja, é possível ter modelos multivariá- 
veis de mesma ordem dinâmica com um diferente número de parâmetros. 
Uma representação, análoga à Eq. 2.44, pode ser escrita como 


y(k) = O"p(k — 1) + e(k), (2.55) 


sendo 


O = [41 42... Any Bi Bo... Ba]! 
Wlk=1) = [y7(k=1) yT(k = ny) UT (k = 1) u(k — nu)”. (2.50) 


A representação (2.55) pode ser interpretada como o conjunto de p re- 
gressões lineares que fazem uso do mesmo conjunto de regressores para ex- 
plicar cada um dos p sinais. O preço a ser pago por usar o mesmo vetor de 
regressores é o aumento do número de parâmetros. Para ver isso, note que 
O €R(ntrn)XP e qp(k — 1) € IRP"tr"o, Uma alternativa para diminuir 
o número de parâmetros é aumentar o número de regressores, permitindo 
que as diversas saídas sejam explicadas por variáveis regressoras distintas. 
Matematicamente, tem-se 


y(k) = UT(k — 1)0 + e(k), (2.57) 


sendo WT(k — 1) E IRPX"e, 9 E IR"º e 


0 = [6 O 
Ya co Vim 

Wa-)= |: (am 
Vo = Yom 
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Complemento 2.3. Modelo! ARIMA 


Um modelo ARIMA (do inglês autoregressive integrated moving average 
process) é obtido a partir de um modelo ARMA conforme descrito a seguir. 
Inicialmente, define-se o operador de primeira diferença de um sinal y(k), 
representado por À, tal que 


Ay(k) = u(k) — u(k — 1). (2.59) 


Da definição (2.59) segue-se que À = 1 — q-!, em que q”! é o operador de 
atraso, ver Exercício 2.13. 

Considere-se um processo ARMA(ny,,n,) como em (2.48) com polinô- 
mios A(q) e C(q), sendo que A(q) pode ser fatorado em termos das suas 
raízes, A, à = 1,2,... Ny Como se segue: 


A(a) = (1= Ma (1 = Agr)... (1 = Ang 1). (2.60) 


Considera-se que uma das raízes é unitária, ou seja, A = 1, em que, 
sem perda de generalidade, assumiu-se que a primeira raiz é unitária, sendo 
que as demais podem ser reais ou aparecem em pares conjugados e que 
satisfazem [A;|< 1, à = 2,3,... ny. Nesse caso, pode-se escrever 


vt) = Mp 


A(a) 
C(a) 
TN agr) io ça) 
Aylk) = Feu), (2.61) 


(1= Agr)... (1= Ang) 


sendo que em (2.61) utilizou-se a relação A = 1 - q"!. O modelo (2.61) é 
um modelo ARMA(ny — 1,n,) do sinal Ay(k), que é a primeira diferença 
de y(k), veja (2.59). 

O análogo do operador de primeira diferença em tempo contínuo é a 
derivada temporal, conforme pode ser facilmente percebido comparando-se 
(2.59) e (1.40). A operação inversa, portanto, é a integração. Em outras 
palavras, para recuperar y(k) usando-se (2.61) é necessário efetuar uma 
“integração discreta”. Por essa razão o modelo (2.61) é chamado de ARIMA. 
Em outras palavras, um modelo ARIMA é um modelo ARMA da primeira 
diferença de um sinal. 

Sabe-se que um modelo ARMA com parâmetros constantes com todas 
as raízes satisfazendo |A;|< 1, à = 2,3,... ,ny, como em (2.61) representa 
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um processo estacionário. Entretanto, a saída do modelo (2.61) é Ay(k) 
e para recuperarmos y(k) é necessário fazer uma “integração discreta”, ou 
seja, calcular o somatório corrido 


k 
v(k) = 55 Avi), v(0) = 0. 
t=1 


Em geral, o somatório corrido de um processo estacionário não será 
estacionário. Assim, percebe-se que o modelo ARIMA surge como uma 
alternativa de modelar séries temporais não-estacionárias produzidas por 
processos com raiz unitária, ou, processos com integração. Séries temporais 
desses sistemas podem ser feitas estacionárias tomando-se a primeira dife- 
rença, sendo que o resultado pode então ser modelado como um processo 
ARMA. Para voltar ao sinal original, deve-se “integrar” a saída do modelo 
ARMA. Esse procedimento é chamado de modelagem ARIMA, em que o 
“T” indica o processo de “integração discreta” envolvido. 


Leitura Recomendada 


A representação de sistemas dinâmicos usando funções de transferência 
e modelos em espaço de estados, bem como suas respostas temporais e 
em fregiiência podem ser encontradas em diversos livros sobre Engenha- 
ria de Controle, tais como (OGATA, 1993; GEROMEL; PALHARES, 2004; 
BAZANELLA; DA SILVA, 2005; PERES, 2007; DE PIERI et al., 2007). Uma 
ótima introdução a representações lineares (em tempo contínuo e discre- 
to), suas respectivas transformadas de Fourier e aplicações, especialmente 
na área de projeto de filtros, pode ser encontrada em (BISCAINHO, 2007). 
Para um estudo mais aprofundado desses assuntos, e principalmente sobre 
a representação no espaço de estados, podem ser consultadas referências 
clássicas, tais como (CHEN, 1998; KAILATH, 1980). 

Diversos aspectos da teoria matemática de sistemas foram descritos em 
(FALEIROS; YONEYAMA, 2002). A representação ARMAX é discutida em 
detalhes em livros de identificação de sistemas (VAN DEN BOSCH; VAN DER 
KLAUW, 1994; LJUNG, 1987). As representações ARMA e ARIMA, no 
contexto de séries temporais, são tratadas em detalhes em (HAMILTON, 
1994; MORETTIN; TOLOI, 2004). 

O artigo de Stoten e Harrison (1994) não apenas discute aspectos prá- | 
ticos e numéricos de mapeamentos do tipo H(s) «+ H(z), mas também 
apresenta tabelas a partir das quais os coeficientes de modelos discretos po- 
dem ser obtidos a partir dos coeficientes de modelos contínuos e vice-versa. 
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O problema da discretização de modelos contínuos não-lineares foi discutido 
em (MENDES; BILLINGS, 2002). 


Exercícios 


2.1, Com respeito ao circuito do Exemplo 2.2.1, pede-se: 


1. Obtenha a função de transferência Ve(s)/V(s); 


9. Use R=100,C=1x10-8eL=1x 10-3e determine os pólos das 
funções de transferência Ve(s)/V(s) e I(s)/V(s); 


3. Simule a resposta dessas funções de transferência ao impulso, degrau 
e rampa unitárias; 


4, Usando u(t) = 170cos(2760t), simule tais funções de transferência 
para a entrada; 


5. Obtenha a resposta em fregiiência do sistema; 
6. Qual é o valor final da corrente para uma entrada em degrau? 


7. Qual é o valor final da tensão no capacitor para uma entrada em 
degrau? 


8. Tente explicar a diferença qualitativamente com base nos seus conhe- 
cimentos da “física do processo”; 


9. Explique a diferença com base nas funções de transferência (presença 
e ausência de zeros); 


10. Simule a resposta do sistema quando a entrada está em curto e o 
capacitor está inicialmente carregado; 


11. Simule a resposta do sistema quando a entrada está em curto, 0 ca- 
pacitor está inicialmente descarregado, mas uma certa corrente está 
fluindo pelo indutor. 


2.2. Mostre que condições 7 e 72 têm que satisfazer a fim de que 


K 


ibid (ms+1)(ras+1) 


apresente oscilações para uma resposta ao degrau. 
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2.8. Verifique que o formato do pulso não influi na resposta do sistema 
desde que o pulso seja suficientemente rápido. Verifique também que a área 
do pulso influi na resposta do sistema. 


2.4, Na Eq. 2.14 tente reconhecer onde e como a parte real e imaginária 
dos pólos afetam a resposta temporal do sistema. 


2.5. Calcule a resposta do sistema com função de transferência Rr(s), em 
função dos resíduos, a uma entrada senoidal, isto é, u(t) = sen(wt). 


2.6. Suponha que no instante t = O a entrada de um sistema de primeira 
ordem sofre uma variação “em degrau”. Mostre que após um período igual 
à constante de tempo do sistema, a saída terá percorrido 63,2% da variação 
total decorrente daquela entrada. Proponha uma maneira de estimar o 
ganho e a constante de tempo de um sistema de primeira ordem a partir da 
sua resposta ao degrau (não necessariamente unitário). 


2.7. Determine a resposta à rampa unitária de um sistema de primeira 
ordem, 


2.8. O uso de assíntotas para representar a resposta em frequência de um 
sistema é aproximado. Determine qual o erro cometido usando-se assíntotas 
para representar a resposta em frequência de um sistema de primeira ordem 
na fregiência de canto. 


2.9. Determine a diferença, em estado estacionário, entre uma rampa uni- 
tária e a resposta do sistema (2.16) quando excitado por tal entrada. 


2.10. Verifique, via simulação, a última afirmativa do Exemplo 2.4.1. Note 
que se a função seno já estiver setada para receber o argumento em rad/s 
em vez de graus, basta fazer u(t) = sen(0,9t). 


2.11. A aplicação da primeira lei de Newton ao sistema de amortecedor de 
um veículo resulta nas seguintes equações: 1º 


meio = —k(Zo—z)—b(Zc— &r) 
mir = k(Ze—z)+b(Ze— £r) + ke(u(t) — Tr), (2.62) 


sendo mc a massa da carroceria, Tc à posição da carroceria, k a constante 
da mola (considerada linear) da suspensão, b o quociente de amortecimento 
do amortecedor (considerado linear). Variáveis com o subíndice “r” são 
grandezas referentes à roda, que é modelada como uma massa que, pela 
ação de uma mola, é deslocada do nível do chão de acordo com a função 
u(t). Assumindo os seguintes valores para os parâmetros mc = 355kg, 
m=46kg, k=14384N/m, k-=3x 10º N/m e b=1860N/m/seg. Pede-se: 
10Synwoo; CHEOKk, 1990. 
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1, Coloque as Eqs. 2.62 no formato de equações de estado (dica: use as 
seguintes variáveis de estado ge, Lc, Lr € Er); 


ns 


. Monte as matrizes de estado para este sistema; 


3. Simule o modelo para o caso em que o carro trafega sobre uma pista 
irregular; 


4. Simule o modelo para o caso em que o carro passa por um quebra-molas; 


5. Simule o caso anterior para diferentes velocidades do carro. 


2.12. Seja a função de transferência assintoticamente estável H(z). Usando- 
se H(z) e um sinal de entrada qualquer u(k), obtém-se por simulação a saída 
v(k). A este sinal é acrescentado ruído branco v(k) a fim de representar 
erros de medição. Escolha uma das representações descritas na Seção 2.6 
que melhor represente este cenário. Que modificação seria necessário fazer 
ao tuído a fim de poder usar a representação ARX? 


2.13. Mostre que a relação entre o operador de atraso e o operador de 
primeira diferença 6 A =1 —q"1. 


2.14. Simule o modelo VARX (2.54) considerando que uj e uz são sinais 


aleatórios e independentes com distribuição gaussiana, média nula e vari- 
ância unitária. Considere as condições iniciais nulas. 
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Métodos Determinísticos 


3.1 Introdução 


Métodos determinísticos são aqueles que não dão nenhum tratamento espe- 
cial ao ruído presente nos dados, ainda que se aceite o fato de que os dados 
estejam contaminados. Conseqiientemente, os métodos determinísticos são 
pouco imunes a ruído e só apresentam bons resultados quando a relação 
sinal/ruído é suficientemente alta. Métodos que levam em consideração o 
ruído presente nos dados, por outro lado, são denominados estocásticos e 
serão tratados a partir do Capítulo 5. 

Métodos determinísticos processam os dados como se não tivessem ruído 
nenhum, como se os dados fossem puramente determinísticos. Por outro 
lado, os métodos estocásticos utilizam recursos adequados para levar em 
consideração o ruído e, dessa forma, reduzir seus efeitos sobre o modelo 
identificado. 

Outras duas categorias são a dos métodos paramétricos e 
não-paramétricos. Essa divisão, na realidade, diz respeito à forma 
do modelo identificado e não necessariamente ao algoritmo ou método 
usado. Apesar disso, é comum referir-se a métodos paramétricos e não- 
paramétricos nos casos em que os modelos resultantes são paramétricos 
e não-paramétricos. Conseqientemente, métodos não-paramétricos de 
identificação resultam em respostas ao impulso e respostas em frequência 
— representações gráficas que não têm nenhum parâmetro explícito. 

De certa forma, os termos “determinístico” e “estocástico” dizem res- 
peito ao algoritmo, ou seja, à forma com que o ruído é tratado no algo- 
ritmo de identificação. Por outro lado, os termos “paramétrico” e “não- 
paramétrico” se referem ao tipo de modelo resultante. Assim sendo, exis- 
tem métodos determinísticos tanto para identificação paramétrica quanto 
para não-paramétrica. Por outro lado, é possível obter um modelo não- 
paramétrico (por exemplo, a resposta em freqiiência do processo) usando 
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tanto métodos determinísticos quanto estocásticos, A gama de combina- 
ções entre métodos é grande, e é possível categorizar as técnicas de várias 
formas diferentes. Optou-se por abordar os métodos determinísticos no pre- 
sente capítulo e os métodos não-paramétricos no capítulo seguinte, apesar 
de haver métodos determinísticos para a obtenção de modelos não para- 
métricos, conforme ilustrado nos Exemplos 3.6.1 e 3.6.2. Alguns métodos 
que podem ser vistos como a interseção dessas duas abordagens, e que ca- 
beriam tanto num capítulo quanto no outro, foram colocados onde parecia 
mais conveniente do ponto de vista didático. Por outro lado, os Capítulos 5 
a 11 dizem respeito a métodos estocásticos para a identificação de modelos 
paramétricos. 


3.2 Alguns Casos Simples 


Nesta seção, serão mencionados dois casos simples para a identificação 
determinística de sistemas. Os casos abordados são: sistemas de primei- 
ra ordem e sistemas de segunda ordem pouco amortecidos. A identificação 
de sistemas de segunda ordem subamortecidos e superamortecidos será tra- 
tada na próxima seção. 

Em todos os casos abordados nesta seção supõe-se que os sistemas não 
tenham atraso puro de tempo. Se este não for o caso, então o atraso puro 
deverá ser estimado separadamente e adicionado ao modelo. 


3.2.1 Sistemas de primeira ordem 


Se o sistema a ser identificado apresenta uma resposta típica de sistemas de 
primeira ordem, então um possível modelo para esse sistema é da forma 


, (3.1) 


sendo que K é o ganho do sistema e 7 é a sua constante de tempo. Se a res- 
posta a um degrau de amplitude A foi registrada e se o nível de ruído nos da- 

dos for suficientemente baixo, é possível determinar com relativa facilidade 

os parâmetros K e 7, O ganho é dado por K = (y(00) — y(07))/A, sendo 
que y(00) é o valor em regime permanente de y(t). A constante de tempo, 
por outro lado, pode ser determinada a partir da resposta ao degrau. No 
período de tempo equivalente a uma constante de tempo, 7, y(t) sai do 
valor que tinha antes da aplicação do degrau e chega a 63,2% da variação 
total devida ao degrau, ou seja, y(7) = 0,632 (y(00) -y(0-)) +y(0-), sendo | 
que foi suposto que o degrau foi aplicado em t = (0. Esses conceitos estão | 
ilustrados na Figura 3.1. 
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Se o sistema tiver atraso puro de tempo, o desenvolvimento acima ainda 
pode ser seguido, mas, nesse caso, t = O será o instante em que o sistema 
começa a responder à entrada. O atraso puro de tempo será igual ao período 
decorrido entre a aplicação do degrau e o início da resposta do sistema à 
entrada. No próximo capítulo será visto como estimar o atraso puro de 
tempo de forma menos restritiva. 


0,632yfintinito)-y(0-)Jey(0-) 


FIGURA 3.1: Resposta ao degrau de um sistema de primeira ordem 


Resposta ao degrau de um sistema de primeira ordem com cons- 
tante de tempo 7. O degrau foi aplicado no instante t = 0. 


3.2.2 Sistemas de segunda ordem pouco amortecidos 


Se o sistema a ser identificado apresentar uma resposta típica de sistemas 
de segunda ordem subamortecido, um possível modelo é a função de trans- 
ferência do tipo 


Y(s) Kw2 


U(s) s2+2Uwns+w? (8:2) 


sendo que wn é a freqiência natural do sistema e ( é o seu quociente de 
amortecimento. 

A seguir, descreve-se um método para estimar wn e ( para uma função 
de transferência do tipo (3.2), para o caso do sistema ser pouco amortecido 
(62 « 1), a partir da sua resposta ao degrau (PHILLIPS; PARR, 1991). No 
desenvolvimento a seguir, assume-se ganho unitário, ou seja, K = 1. Ao 
final do procedimento o ganho será estimado e incorporado ao modelo. A 
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resposta temporal de (3.2) ao degrau unitário é 
yjei- pe en(funt +), (3.3) 


sendo que 8 = VI-(e 4 = tan!B/Ç A fregiiência amortecida é 
w = wn), e o número de oscilações em um segundo, ou seja, a freqiiên- 
cia do sinal amortecido, em hertz, é w/2m. Conforme pode ser visto na 
Eq.3.3, o envelope ou a componente modulante do sinal amortecido tem 
uma constante de tempo igual a 7 = 1/(wn 8. Portanto, o número de ciclos 
do sinal amortecido no período de uma constante de tempo é 


w/2m unB 1 vl-(2 
tm Ort E” (84) 


Supondo agora que, após N constantes de tempo, as oscilações não são 
mais perceptíveis, então o número de ciclos visíveis na resposta do sistema 
a uma entrada em degrau é dado por 


1-(2 
EE (3.5) 
Sabe-se que, para funções de transferência do tipo (3.2), a resposta ao 
degrau se mantém dentro da faixa de + 2% do valor em regime permanente 
após quatro constantes de tempo, ou seja, nesse caso N = 4. Assumindo 
que o sistema é pouco amortecido de forma a se ter (2 « 1, o número de 
ciclos visíveis pode ser aproximado por 


06 
É 


A exatidão da equação acima, evidentemente, depende de quão boa é a 
aproximação 1 — (2 x 1, A fregiiência w pode ser estimada diretamente 
do gráfico e da escala de tempo, Como foi assumido que 1 — (2 x 1, então 
wn = w. Finalmente, o ganho K é obtido conforme descrito na Seção 3.2.1, 
isto é, K = (y(00) — y(07))/A. 


(3.6) 


Exemplo 3,2,1, Estimação de ( e wn 


A Figura 3,2 mostra as respostas ao degrau unitário de dois sistemas de 
segunda ordem do tipo (3.2), com K = 1, wn = 1 e com os seguintes valores 
distintos do quociente de amortecimento, ( = 0,15 e ( = 0,4. 

Aplicando-se o procedimento acima à resposta menos amortecida e, 
usando-se (3.6), obtém-se 


id 
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o 5 10 15 20 25 30 as 
t 


FIGURA 3.2: Resposta ao degrau de sistemas subamortecidos 
Resposta ao degrau unitário da função de transferência (3.2) com 
K =1,wn = 1e quociente de amortecimento (—) € = 0,15; 
(--) (=0,4 (ex322 0). 


É interessante notar que se houvesse um pouco de ruído nos dados seria 
natural contar apenas quatro ciclos completos, o que resultaria em ( = 0,15. 
Observando a figura, nota-se que aproximadamente quatro ciclos ocorrem 
nos primeiros 25 segundos. O “período médio”, então, pode ser estimado 
como T = 25/4 = 6,25, e wn = 27/T = 19, conforme esperado. Por outro 
lado, é mais difícil contar ciclos para a resposta mais amortecida. Mesmo 
na presença de pouco ruído, apenas um ciclo seria visível, o que resultaria 
em ( x 0,6, que é 50% maior que o valor usado. [mn] 


3.3 O Método de Sundaresan 


Nesta seção será apresentado um método de identificação conhecido como 
o método de Sundaresan (DESHPANDE; AsH, 1981). Este método pressu- 
põe que o sistema em questão pode ser aproximado satisfatoriamente por 
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funções de transferência de segunda ordem do tipo 


erTas 
Fo) = tremer) o 
ou 
His es (3.8) 


2 +MUwns + uw2” 


sendo que 73 é o atraso puro de tempo (ou tempo morto ou, ainda, atraso de 
transporte), 71 € 72 são constantes de tempo fixas, ( é o quociente de amor- 
tecimento e wn é à fregiência natural do sistema. Modelos do tipo (3.7) 
são usados para descrever sistemas dinâmicos lineares de segunda ordem e 
sobreamortecidos, ou seja, sistemas que não oscilam quando excitados por 
um degrau. Por outro lado, modelos do tipo (3.8) representam sistemas 
de segunda ordem subamortecidos que, por ter pólos complexos conjuga- 
dos, normalmente apresentam oscilações nas suas respostas ao degrau e ao 
impulso. 

O objetivo do método é determinar os parâmetros 7a, 71 € 72 OU Tg, Wn € 
( da respectiva função de transferência, a partir de uma resposta ao degrau. 

Deve ser notado que as funções de transferência acima têm ganho uni- 
tário. Na maioria dos casos práticos será necessário determinar o ganho do 
processo (que provavelmente será diferente de um) e acrescentá-lo ao mo- 
delo. O ganho é a razão entre a variação do sinal de saída pela amplitude 
do degrau aplicado, conforme visto anteriormente. A seguir descreve-se o 
procedimento para determinação dos parâmetros. 


3.3.1 O caso sobreamortecido 


Uma resposta ao degrau típica de sistemas sobreamortecidos é mostrada 
na Figura 3.3, Deve ser notado que essa figura pressupõe que o degrau 
de entrada é unitário e que foi aplicado ao sistema no instante t = O. 
Além disso, o valor em regime permanente é unitário, Portanto, sugere-se 
determinar o ganho DC e depois normalizar os dados reais antes de aplicar 
o método a ser descrito abaixo. 

O primeiro momento da função resposta y(t) é a área hachurada na 
Figura 3.3 e é dado por ] 


m = [ (= ulojde (3.9) 


A função de transferência H(s) e m, estão relacionados pela seguinte 
definição: 
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o 5 10 15 
t 


FIGURA 3.3: Resposta ao degrau de sistema sobreamortecido 


Resposta ao degrau típica de um sistema sobreamortecido com 
tempo morto. 


m = ço ra + rt (3.10) 
A resposta de (3.7) ao degrau é 
t-r, t-r, 
ut) = Ê .n ta e) e] u(t — 7a), (3.11) 
nt n—n 


sendo que u(t — 74) é um degrau unitário deslocado para o instante t = 74, 
ou seja, a transição nesse sinal ocorre em t = 74. Igualando-se a derivada 
de segunda ordem de (3.11) a zero, obtém-se o ponto de inflexão 
t;=Ta + clnn, (3.12) 

sendo que m = 71/72 e a =miT2/(71 — 72). À inclinação da reta tangente no 
ponto de inflexão é 

Tp 

“Co a(n—1) 


Esta reta tangente intercepta o valor final de y(t) num ponto correspondente 
ao instante tm dado por 


(3.13) 


7-1 
tm=Ta+Ha [nn+ 7 |: (3.14) 
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Combinando-se as Eqs. 3.10, 3.13 e 3,14, obtém-se 


nin) 
Mi(tm -m)= n=1 


Inn. (3.15) 


Note que se nesta equação 1) for substituído por 1/n, a equação não se altera. 
Além disso, ela pode ser reescrita da seguinte forma: 


A=xe*, (3.16) 
sendo que À = (tm — mi)M; e 
“nm 
X= 51 (3.17) 


O máximo valor de À é e-! e ocorre quando o sistema é criticamente 
amortecido (m = 1). O outro extremo é quando = 0, e neste caso o 
modelo se reduz a um de primeira ordem. A Figura 3,4 mostra a solução 
da Eq.3.16. 


Portanto, o procedimento pode ser resumido da seguinte forma: 


1. determinar o ganho em regime permanente dividindo-se a variação do 
sinal de saída pela amplitude do degrau aplicado à entrada; 

. remova 0 valor da condição inicial e normalize os dados de maneira a 
ter uma resposta no formato da Figura 3.3; 

. determinar a área sombreada na Figura 3.3. Este valor é mi; 

. determinar a inclinação da tangente no ponto de inflexão de y(t). Este 
valor é M;; 

. determinar tm que é a interseção da tangente com o valor em regime 
permanente de y(t); 

. determinar À a partir de À = (tm — mi) M;; 

. determinar 1 a partir do gráfico da Figura 3.4, que corresponde à 
solução da Eq. 3.16, substituindo-se x pela Eq. 3.17; 

. finalmente, determinar 71, 72 € T4 como se segue: 


o) 


e co 


e 


ao 


oo 


= 


Ti = mM-T—Ta (3.18) 
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8r 015 02 04 03 035 4 
lambda 
FIGURA 3.4: Gráfico para uso no método de Sundaresan 


Solução de (3.16) substituindo-se x pela Eq. 3.17. 


3.3.2 O caso subamortecido 


A Figura 3.5 mostra uma resposta ao degrau típica de sistemas de segunda 
ordem subamortecidos. A equação que descreve esta resposta temporal é 


ut) = ult—Ta) E — e Sun(t-ra) | ré-ge (ont — ra)V1=€) SE 
+ 008 (an(t — 19) 1 =63)]) (3.19) 


Seguindo um procedimento semelhante ao anterior, as seguintes equa- 
ções podem ser obtidas: 


=1 =Gcos—1 
arts SEEM proa (3.20) 


VITA 


esc. À 
== :21 
Wn RR PRETA (3.21) 
KB gs A, (3.22) 
n 


As equações acima são utilizadas na determinação dos parâmetros de 
(3.8). Primeiramente, deve-se determinar mi. Para o caso subamortecido, 
é importante notar que, no cálculo de m,, as áreas acima de y(t) = 1 são 
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consideradas negativas e as áreas abaixo, positivas. Portanto, os valores de 
my e de tm podem ser obtidos a partir do gráfico ou dos dados medidos. 


14 + e 


10 15 
t 


FIGURA 3.5: Resposta ao degrau de sistema subamortecido 


Resposta ao degrau típica de um sistema subamortecido com tem- 
po morto. 


A Eq.3.20 mostra a relação entre o quociente de amortecimento ( e 
o parâmetro À. Note que À é determinado a partir do conhecimento de 
ma € tm, obtidos a partir do gráfico da resposta em degrau. M; que é 
a inclinação da curva no ponto de inflexão, não mostrada na Figura 3.5. 
Como seria muito difícil obter analiticamente ( a partir de À na Eq. 3.20, 
isto pode ser feito graficamente a partir da Figura 3.6, que mostra a relação 
entre tais parâmetros. 

Finalmente, as Egs. 3.21 e 3.22 podem ser utilizadas para determinar os 
demais parâmetros da função de transferência. Portanto, o procedimento 
completo para o caso subamortecido é: 


1. determinar o ganho em regime permanente, dividindo a variação do 
sinal de saída pela amplitude do degrau aplicado à entrada; 

2. remova o valor da condição inicial e normalize os dados de maneira a 
ter uma resposta no formato da Figura 3.5; 

3, determinar a área sombreada na Figura 3,5, a área acima do valor de 
y(o0) (que é igual a 1, na Figura 3.5) deve ser subtraída. Este valor 
émi; 

4. determinar a inclinação da tangente no ponto de inflexão de y(t). Este 
valor é M;; 
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5. determinar tm, que é a interseção da tangente com o valor em regime 
permanente de y(t). Esse tempo, na prática, pode ser aproximado 
utilizando-se a interseção da resposta y(t) com o valor em regime 
permanente; 

6. determinar À a partir da Eq. 3.20; 

7. determinar ( a partir do gráfico da Figura 3.6, que corresponde à 
solução da Eq. 3.20; 

8. determinar wn e 74 à partir das Egs. 3.21 e 3.22, respectivamente. 


FIGURA 3.6: Gráfico para uso no método de Sundaresan 
Relação entre ( e À, Eq. 3.20. 


Exemplo 3.3.1, O método de Sundaresan ! 


Este exemplo descreve brevemente a aplicação do método descrito nesta 
seção na identificação determinística de funções de transferência de segunda 
ordem com atraso puro de tempo para plantas de combustível que integram 
uma caldeira industrial real, Não se objetiva aqui descrever detalhadamente 
a planta, mas sim ilustrar o procedimento de identificação. Detalhes da 
Planta e do resultado da identificação podem ser encontrados em (PENA et 
al., 1986; AGUIRRE et al., 1996). 

A Figura 3.7 mostra a malha de controle de combustíveis. Trata-se de 
um sistema de controle que injeta até quatro combustíveis na fornalha de 
uma caldeira industrial, A malha é composta por quatro malhas individuais 
(uma para cada combustível) e uma malha global externa. A contribuição 
calorífica de cada combustível é levada em conta no bloco somador, cuja 


"DesupaNDE; As, 1981, 
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saída é realimentada no controlador PID da malha externa. A ação de con- 
trole de tal controlador é representativa do que os quatro combustíveis em 
conjunto precisam suprir à fornalha. A fim de evitar que as quatro ma- 
lhas de combustível procurem suprir individualmente a demanda solicitada, 
a ação de controle do controlador global passa por um limitador do tipo 
máximo/mínimo e três subtratores. Na saída dos controladores de vazão 
de cada malha, há limitadores do tipo máximo/mínimo usados para limi- 
tar as vazões de acordo com a disponibilidade de cada combustível. Os 
blocos denominados “planta” correspondem às tubulações, conversores cor- 
rente/pressão (I/P) e válvulas para cada combustível, São esses subsistemas 
da caldeira que se deseja modelar no presente exemplo. 


Sinal de master 


FIGURA 3.7: Malha de controle de combustíveis de uma planta industrial 


Malha de controle de combustíveis de uma planta industrial real. 
Os blocos “FIC” são os controladores de vazão de cada combus- 
tível, Os blocos “subtrator”, “somador”, “max/min” e “” repre- 
sentam circuitos com funções aritméticas. 


Devido à falta de medições específicas e de dados de fabricação, não 
seria possível derivar modelos pela física do processo para os subsistemas 
denominados “planta”. Portanto, prosseguiu-se à identificação usando-se 
testes, conforme descrito a seguir. 

Há três aspectos importantes a serem considerados na execução dos 
testes: i) a amplitude do sinal de excitação; ii) o ponto de operação; e iii) o 
sentido do sinal de excitação. 

Como os modelos utilizados são lineares, deve-se garantir que o com- 
portamento do processo durante o teste seja o mais linear possível. Uma 
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maneira de tentar garantir isso é manter a amplitude do sinal de excitação 
tão pequena quanto possível, Por outro lado, como o processo é claramente 
não-linear, torna-se desejável obter vários modelos, um para cada faixa de 
operação. Espera-se, assim, que juntos tais modelos descrevam a dinâmica 
do processo em uma ampla faixa de operação. Portanto, cada planta deverá 
ser testada em torno de pontos de operação distintos que cubram a faixa 
de operação de interesse. Finalmente, a fim de verificar se as plantas têm 
algum tipo de histerese ou comportamento dependente do sinal da derivada 
das respectivas variáveis de entrada, para cada ponto de operação é dese- 
jável efetuar testes em ambos os sentidos. Isso é conseguido aplicando-se 
degraus positivos e negativos, em testes independentes. 

O método de identificação a ser utilizado considera que a totalidade 
da resposta medida do sistema se deve somente ao sinal de entrada, que 
é um sinal em degrau. Consegientemente, é indispensável garantir que 
o processo esteja tão estacionário quanto possível no momento do teste. 
Portanto, deve-se esperar até que a planta atinja o regime permanente antes 
de iniciar o teste. 

Em se tratando da malha de controle de combustíveis, é importante 
deixar pelo menos um combustível livre a fim de que seja capaz de suprir 
a demanda resultante de todas as flutuações de carga, permitindo, assim, 
que a planta sob teste sofra o mínimo de influência externa. 


38 e fã T T 


10 20 40 so 60 


30 
tempo (s) 
FIGURA 3.8: Testes para entrada ao degrau realizados em indústria 


Entrada (superior) e respostas (inferior) para a malha de BFG. 
(—) medição feita em indústria (bfg3 O) e (- -) simulação feita 
usando-se Hi(s). 
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O sinal em degrau é aplicado colocando-se o controlador da malha a ser 
testada em modo manual, Isso garante que a saída do controlador não será 
alterada em função da carga nem do valor de referência (set-point). O de- 
grau é aplicado forçando-se a saída do controlador para um novo valor, que 
deve ser suficientemente perto do valor anterior para evitar que o processo 
saia da sua faixa de linearidade. Por outro lado, a transição entre o primei- 
ro e o novo valor da saída do controlador deve ser suficientemente rápida 
para que o processo “veja um degrau”. Testes com tais características fo- 
ram executados pelo operador diretamente do painel de controle da central 
termoelétrica. 


5 


3 as 40 45 so 


25 
tempo (s) 


FIGURA 3.9: Testes para entrada ao degrau realizados em indústria 


Entrada (superior) e respostas (inferior) para a malha de BFG. 
(—) medição feita em indústria (bfg44 (0) e (- -) simulação feita 
usando-se Hs(s). 


As Figuras 3.8, 3.9 e 3.10 mostram alguns dos testes efetuados na malha 
de gás de alto-forno (BFG). Os dados em bfg44 O foram amostrados a 
uma taxa de 10 Hz. Testes nas malhas de gás de aciaria (BOFG), coqueria 
(COG) e óleo são qualitativamente semelhantes. Aplicando-se o método da 
Seção 3.3 às respostas dessas figuras, obtêm-se os seguintes modelos: 


1,338e-188 
Flo) = ramos + (LO FT) 
0,0182e-478 
H paul DAS agp 
À) = 750,02 5000 
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0,189e-20s 
52 + 2(0,55)(0,346)s + 0,120" 


Hs(s) = 


As Figuras 3.8, 3.9 e 3.10 também mostram as respostas dos modelos 
Hi(s), Ha(s) e Hs(s) quando excitados pelas entradas medidas na planta. 
Pode-se notar que os modelos Hi(s) e Ha(s) ajustaram-se excepcionalmente 
bem aos dados obtidos durante os testes. Por outro lado, observando-se a 
Figura 3.9, nota-se que o modelo H»(s) não se ajustou tão bem aos dados 
medidos quanto Hi(s) e Ha(s). Uma possível razão para isso pode ser que 
a resposta medida não se enquadra nas respostas bem aproximadas para os 
modelos lineares de segunda ordem com atraso puro de tempo. Vale a pena 
notar que a amplitude do degrau de entrada na Figura 3.9 é praticamente 
o dobro da amplitude nos outros dois testes. Consegiientemente, é possível 
que tal entrada tenha tirado o processo da faixa de operação na qual ele 
pode ser bem aproximado por modelos lineares. D 


o 5 10 25 30 E) 


15 20 
tempo (s) 


FIGURA 3.10; Testes para entrada ao degrau realizados em indústria 


Entrada (superior) e respostas (inferior) para a malha de BFG. 
(—) medição feita em indústria e (- -) simulação feita usando-se 


Hs(s). 


3.4 Identificação em Malha Fechada 


O problema de identificação em malha fechada é de interesse prático. Do 
ponto de vista teórico, é possível mostrar que o processo pode-se tornar 
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não identificável em malha fechada (SODERSTRÓM; STOICA, 1989) apesar 
de que, na prática, esse problema é bem menos fregiiente (LENNOX el al,, 
2001). 

A abordagem nesta seção será prática e consistirá da descrição de um 
método baseado na resposta ao degrau. O método a ser descrito foi ori- 
ginalmente proposto por Yuwana e Seborg (1982). Considere o seguinte 
diagrama de blocos mostrado na Figura 3.11. 


R(s) Y(s) 


FIGURA 3.11: Diagrama de blocos de malha fechada 


Sistema de controle em malha fechada. 


No presente método, assume-se que o controlador é puramente propor- 
cional, ou seja, Ge(s) = Kc e que a função de transferência do processo tem 
a seguinte forma: 


KeTas 
Ts+1" 


H(s) = (3.23) 


sendo que K, Tg € 7 são respectivamente o ganho, o atraso puro de tempo 
e a constante de tempo do processo. Funções de transferência com esta 
estrutura são comumente utilizadas para descrever um grande número de 
processos industriais reais. 

A resposta típica a um degrau aplicado à referência r(t) é mostrada na 
Figura 3.12, que mostra a resposta ao degrau da função de transferência em 
malha fechada 


Y(s) + KçerTas 

R(s) ts+[Kçe-ras +) (8:28) 
sendo que Kf = KcK. O método descrito a seguir pode ser usado para 
estimar os parâmetros do processo se a resposta ao degrau em malha fechada 
for subamortecida. 

O uso da expressão (3.24) na estimação de seus parâmetros não é de todo 
simples, pois o tempo morto é o expoente do número e e, assim, caracteriza 
uma não-linearidade. A fim de contornar esse problema, pode-se utilizar a 
seguinte aproximação de Padé (ver Eq. 2.20 e Seção 14.3) 
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15 


os 


o 2 4 6 8 To, 14 16 18 20 


FIGURA 3.12: Resposta ao degrau típica 
Resposta ao degrau típica necessária para o método proposto por 
Yawana e Seborg (1982). Nesta figura yoo = y(00) = 1. 


1-05rgs 
Erdd riso morta 
e 1+0pras' 18:85) 


Portanto, substituindo (3.25) em (3.24), obtém-se, após algumas mani- 
pulações, 
Y(s) + K(1 — Obras) 
R(s) Psl+2grs+1" 19:46) 
sendo 


fe vá tie (3.27) 


s TdT 8 
= lema) o cam 


ais +0bra(l — Kr) 


ç v2rar(Kr + 1) ; 


(3.29) 
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Os parâmetros do processo podem ser obtidos das seguintes expressões: 


= Vo 
E Tea) Rm 


sendo que yo = y(00) é o valor de y(t) em regime permanente, A é a 
amplitude do degrau aplicado à referência do sistema de controle, É de 
vital importância notar que (3.30) supõe que y(0) = O (ver Figura 3.12) e 
que o sistema está em malha fechada com controle puramente proporcional 
(ver Exercício 3.6). Na prática, entretanto, o sistema estará a um certo 
valor yo no início do teste, ou seja y(0) = yo, que precisa ser subtraído de 
y(t) antes de se usar o presente método. A constante de tempo é dada por 


r= A [eVRrri + VC FÃ] (1-C)(K+1), (3.31) 


24t/1=CJK+) 


ge [evRrFT 1+ VC +) +Ki| 


sendo que ( pode ser avaliada de duas formas diferentes: 


(3.32) 


(= é ( E [ns - (3.33) 
e (fg) 


Ypl—Voo 


ou 


— In | teztco 
Vpi— Voo 


(===: (3.34) 
412 + (in [re] 


Vpi—Voo 


Na prática, é comum usar o valor médio de (3.33) e (3.34). 

Às cinco variáveis independentes que aparecem nas Egs. 3.30 a 3.34 po- 
dem ser obtidas diretamente a partir da resposta ao degrau em malha fe- 
chada, como mostrado na Figura 3.12, 

Alguns processos reais levam muito tempo para convergir ao valor final 
Voo: Em outros casos, não é possível esperar até que o processo atinja 
Voo por questões operacionais, tais como mudança do ponto de operação, 
distúrbio de carga etc. Nesses casos, é possível estimar o valor em regime 
permanente como se segue: 
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2 
YpaYpi — Um (3.35) 
voo ra + Upi — 2Um” 


sendo que ypt, Yp2 € Ym São mostrados na Figura 3.12. Vale a pena notar 
que a Eq.3.35 pode ser usada para estimar o valor final de uma resposta 
subamortecida tanto em malha aberta quanto em malha fechada e para 
sistemas de qualquer ordem, desde que a resposta seja do tipo mostrada na 
Figura 3.12. 

Finalmente, ao aplicar o método descrito nesta seção, deve-se tomar o 
cuidado de notar que (3.30) pressupõe que a resposta do sistema começa de 
zero, ou seja, y(0) = O e que o degrau de entrada é positivo. Em casos onde o 
ganho do sistema é negativo ou o teste em malha fechada foi executado com 
degraus decrescentes, a Eq. 3.30 deve ser usada fazendo-se as modificações 
necessárias. 


Exemplo 3.4.1. Identificação em malha fechada de um processo real 


Neste exemplo o objetivo é obter modelos em malha aberta, do tipo 
(3.23) a partir de dados reais coletados numa planta industrial real operando 
em malha fechada. Trata-se de uma malha de corrente de um separador 
magnético. Na execução do teste houve a preocupação de deixar apenas a 
banda proporcional do controlador PID ativa. A Figura 3.13a mostra os 
dados coletados durante o teste. 

A partir de um gráfico dos dados medidos obtiveram-se os seguintes valo- 
res aproximados: ypi = —53, Yp2 = —34, ym = —14,5, At = 6, yoo = —24,6 
e a banda proporcional do controlador era 50, portanto Kç = 100/50 = 2. 
Deve ser notado que para se obter esses valores é necessário subtrair dos 
sinais medidos os respectivos valores que tinham logo antes da aplicação do 
teste. Com esses valores aproximados e usando-se o procedimento detalhado 
na presente seção, chegou-se ao seguinte modelo em malha aberta: 


3,6020 e-2991s 

Ho) = gos +T" (830) 
cuja resposta em malha fechada (com controlador puramente proporcional 
e Kc = 2) está mostrada na Figura 3.13b. As razões para as diferenças 
observadas são diversas. Dentre elas destacam-se duas. Primeiramente, o 
processo em malha aberta não é exatamente do tipo (3.23), uma vez que o 
formato das oscilações do processo real são diferentes do modelo simulado 
em malha fechada. Em segundo lugar, o desenvolvimento apresentado nesta 
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FIGURA 3.13: Identificação em malha fechada de um processo real 


Respostas em malha fechada a uma mudança em degrau no sinal 
de referência (set point), (a) medido (mf643 0), (b) resposta do 
modelo (3.36). 


seção parte do princípio de que não há dinâmica apreciável no ramo de 
realimentação, o que pode não ter sido o caso na prática. Entretanto, a 
resposta em malha fechada a um degrau na referência do modelo Hy(s) 
em (3.36) parece reproduzir algumas das características básicas da resposta 
medida, sugerindo, assim, que as considerações feitas pelo método aplicam- 
se de forma relativamente satisfatória no caso em estudo. o 


3.5 Identificação Usando Convolução 


Os métodos descritos até o presente momento pressupõem que o processo 
a ser identificado tenha sido excitado por entradas específicas tais como o 
degrau. Apesar dessas entradas serem produzidas com relativa facilidade e 
encontrarem aplicação em diversos processos, o uso exclusivo de tais sinais 
é um tanto quanto restritivo, Nesta seção, descreve-se um procedimento no 
qual a entrada não precisa ser necessariamente nenhum dos sinais mencio- 
nados acima, 

Uma vez que se deseja obter a resposta ao impulso h(k) a partir de 
medições dos sinais de entrada e saída, u(k) e y(k), respectivamente, pode- 
se considerar o somatório de convolução (ver Exercício 3.9) 
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v(k) = sa (uk — 5). (3.37) 


j=0 
Portanto, tomando-se as medições u(k) e y(k) e usando o somatório de 
convolução, pode-se escrever o seguinte conjunto de equações: 
v(O) = h(O)u(0) + A(1)u(=1) + h(2)u(—2)... 
v(l) = h(O)u(1) + h(Du(0) + A(2)u(=1)... 
v(2) = h(0)u(2) + h(1)u(1) + h(2)u(0)... 


que pode ser expresso em forma matricial como se segue: 


v(0o) u(0) u(-1) u(-2) ... h(0) 
v(1) o [ui u) u(=1) +. h(1) 


(2) u(2) u(l) u(0) ... n(2) |» 


y = Uh. (3.38) 


Se a resposta ao impulso h(k) for longa e se o sinal de entrada u(k) 
for muito “suave”, então U será de grande dimensão e mal condicionada. 
Entretanto, se u(k) for um sinal “suficientemente ativo” e se o número de 
parâmetros a estimar não for excessivo, o procedimento acima pode, em 
princípio, ser usado. Nesse caso, truncando-se U de maneira a ser quadra- 
da, da Eq.refuh pode-se obter a seguinte solução h = U-ly. Como essa 
solução fornece a resposta ao impulso a partir dos sinais de entrada e saída, 
ela pode ser interpretada como a operação inversa da convolução, ou seja, 
a deconvolução. No próximo capítulo será introduzido o conceito de um 
sinal persistentemente excitante (ver Seção 4.5 e Complemento 4.1), o que 
permitirá caracterizar de forma mais rigorosa a expressão “suficientemente 
ativo”, 

A solução por deconvolução não limita u(k) a entradas padronizadas. 
Entretanto, para fins de análise, será instrutivo considerar o caso em que 
a entrada é o impulso unitário. Assim, se u(k) = 0, Vk £ 0, é possível 
simplificar a Eq. 3.38, pois nesse caso U torna-se diagonal com todos os 
elementos idênticos, e a Eq. 3.38 pode ser escrita da seguinte forma: 


u(0)Ih, 
y/u(0). (3.39) 


y 
h 


Digitalizado com CamScanner 


162 3 MÉTODOS DETERMINÍSTICOS 


Para o caso em que u(0) = 1, ou seja, se a entrada for um pulso de 
amplitude unitária e duração igual a um período de amostragem, a Eq. 3.39 
resulta em h = y, Esse resultado não é nenhuma surpresa, uma vez que uma 
entrada de amplitude unitária e duração igual a um período de amostragem 
é vista pelo sistema praticamente como um impulso e, assim, h pode ser 
determinada como a resposta do sistema a tal pulso de área unitária e de 
curta duração. 

Agora, considere o caso em que o sinal de saída está contaminado com 
ruído de medição, ou seja, y(k) = y'(k) + e(k), sendo que y'(k) é o sinal 
ideal e e(k) é ruído de medição. Substituição direta em (3.39) resulta em 


i i 
À Lada d (3.40) 


A equação acima revela que o valor calculado para h(k) é composto 
de duas parcelas, a saber: uma parcela ideal, que é a desejada, e uma 
parcela que surge em função do ruído. Claramente, a parcela de interesse é 
a primeira, sendo que a segunda delas é uma polarização. Portanto, pode-se 
dizer que o estimador da resposta ao impulso dado por (3.39) é polarizado 
na presença de ruído de medição, conforme visto em (3.40). Há basicamente 
duas situações em que o efeito da segunda parcela na Eq. 3.40 é eliminado: 
i) quando a amplitude do pulso do sinal de entrada é infinita (u(0) — oo) 
ou ii) quando o ruído não existe (e(k) = 0). Essas duas situações são 
claramente irreais. No próximo capítulo serão usadas funções de correlação 
em vez de usar diretamente as medições u(k) e y(k) para estimar A(k) e, 
nesse caso, a condição e(k) = O poderá ser relaxada. 


Exemplo 3.5.1. Estimação determinística da resposta ao impulso 
Seja a função de transferência 


Ye) 2+05 
mig U(z) 2-152+07' 


A fim de ilustrar o uso da Eq. 3.38, H(z), foi simulada para uma entrada 
pseudo-aleatória (ver Seção 4.3). A justificativa para o uso de tais sinais e 
a sua geração serão discutidos detalhadamente no próximo capítulo. 

A partir dos sinais de entrada e de saída do modelo H(z), mostrados na 
Figura 3.14, montou-se a matriz U € IR$ºX40, O vetor y é o próprio sinal 
de saída mostrado na Figura 3.14. Como U é quadrada e não singular, h 
pode ser determinado usando-se a Eq. 3.98. 
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o 5 10 15 20 25 30 as “0 
amostras 


FIGURA 3.14: Sinais de entrada e de saída para identificação 


Sinais de (a) entrada e (b) saída de H(z). O traço contínuo foi 
adicionado a fim de facilitar a visualização. 


a 

É 

ja 

t 

(a) e 

9 q r E & 
2 = 
] 

É 
o E 
a 

- = 
5 10 15 20 2s 30 as so a, 


-1 — + a: am — + Dn a À 
o 5 10 15 20 25 30 as 40 
amostras 


FIGURA 3.15: Resposta ao impulso “real” e identificada 


Resposta ao impulso de H(z) (0) junto com as respostas ao impul- 
so obtidas calculando-se h = U-ly (+), para o caso (a) sem ruído, 
e (b) com ruído de variância o2 = 1 x 1075. O traço contínuo foi 
adicionado a fim de facilitar a visualização (ex351 O). 
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A Figura 3.15a mostra o resultado obtido e a simulação de H(z). Ao 
se dicionar ruído ao sinal de saída mostrado na Figura 3.14b, e repetindo 
o procedimento detalhado acima, chega-se à resposta mostrada na Figu- 
ra 3.15b. 

A variância do ruído adicionado foi muito baixa (o? = 1 x 1075) e, no 
entanto, nota-se que a resposta determinada começa a divergir da resposta 
“real” a partir de h(21). A razão da sensibilidade ao ruído adicionado é 
que h é obtida de forma determinística ao se calcular h = U-ly. Essa 
observação serve de motivação para desenvolver métodos estocásticos de 
modelagem, que serão apresentados a partir do próximo capítulo. D 


3.6 Identificação no Domínio da Fregiiência 


Na Seção 2.4 foi verificada uma propriedade importante de sistemas lineares, 
que pode ser representada matematicamente pela Eq. 2.27 e ser enunciada 
da seguinte forma: a resposta em regime permanente de um sistema linear 
assintoticamente estável, excitado por um sinal senoidal de fregiência w, 
também será senoidal com frequência w. No entanto, a amplitude e a fase da 
resposta do sistema linear podem ser alteradas com respeito à entrada. Em 
particular, a amplitude do sinal de entrada será multiplicada por | H'(jw)| 
e a sua fase será defasada de à radianos, sendo que H(jw) = | H(jw)| e?* é 
a resposta em frequência do sistema linear e h(t) é sua resposta ao impulso. 
Essa propriedade se deve ao fato que, em sistemas lineares, as freqiências do 
sinal de entrada passam pelo sistema independentemente umas das outras. 

A propriedade mencionada acima sugere um procedimento simples para 
a estimação da resposta em fregiência H(jw). Para isso basta excitar o 
sistema a ser identificado com sinais senoidais de fregiências wo,W1,..-, 
wnç-1: Para cada fregiiência, após atingir o regime permanente, o ganho 
do sistema é dado pela razão entre a amplitude da saída e a amplitude do 
sinal de entrada. A fase pode ser determinada pelo deslocamento temporal 
entre os sinais de entrada e saída. 

O procedimento acima tem, obviamente, diversas dificuldades de ordem 
prática. Uma delas é que nem sempre é possível aplicar sinais senoidais ao 
processo a ser identificado. Outra dificuldade é a longa duração do teste 
que seria requerido. Deve ser notado que para cada fregiiência é necessário 
esperar que o sistema atinja o regime permanente. Portanto, o procedimento 
acima requer a execução de Nr testes a fim de conhecer H(jw) em Nr 
fregiências diferentes. 

Uma solução para o segundo problema mencionado é o uso da Transfor- 
mada de Fourier (TF) dos sinais de entrada e saída. Assim, aplicando-se à 
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TF à integral de convolução, pode-se estimar a resposta em fregúência da 
seguinte forma: 


Áju) = E (3.41) 


sendo que Y(jw) e U(jw) são as transformadas de Fourier de y(t) e u(t), 
respectivamente. Portanto, a resposta em fregiência H(jw) pode ser es- 
timada usando-se a Eq. 3.41, quando u(t) não for um sinal puramente 
senoidal. Evidentemente a Eq.3.41 requer que U(jw) £ 0, Vw. Entre- 
tanto, se acontecer que para o sinal de teste usado, em Nf fregiiências 
w=w=0,i=1,2,...,Nr, diz-se que H(jw) não é definida nessas fregiên- 
cias. 

Se, por um lado, o uso da TF elimina a necessidade de fazer um grande 
número de testes senoidais independentes, por outro, restringe o uso de si- 
nais u(t) e y(t), tais que suas respectivas transformadas de Fourier existam. 
A TF de sinais “abertos”, como a resposta ao degrau de um sistema assin- 
toticamente estável, não é definida. De forma mais precisa, diz-se que uma 
das condições necessárias para que exista a transformada de Fourier de um 
sinal é que esse sinal deve ser absolutamente integrável, ou seja, a integral 
do valor absoluto do sinal no intervalo [0,00) deve ser finita. Felizmente, 
existem soluções simples para esse problema na maioria dos casos. Por 
exemplo, suponha que estejam disponíveis apenas um degrau e a respectiva 
resposta do sistema. Diferenciar esses sinais é uma forma de se obter sinais 
“fechados” e o uso de tais sinais não altera a resposta em freqiiência, como 
pode ser visto a seguir: 


No caso de sinais discretos “abertos”, a seguinte transformação pode ser 
utilizada para possibilitar o uso da transformada discreta de Fourier (TDF) 
(RAKE, 1980): 


v'(k) = u(k — 1) — uk) e u'(k) = u(k — 1) — u(k), 


e, nesse caso, a estimativa da resposta em fregiiência é 


joy — X(eio) 
(e) = Ur(e)? 


sendo que foi adotada a convenção de se usar o argumento ei nos casos 
das transformadas de Fourier de sinais discretos. 
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À semelhança do fim da Seção 3,5, euponlia que o sinal usado y(t) é 
composto de uma parcela ideal (sem ruído) '(t) e de ruído e(t) de medição, 


Logo, 


m. 1 YiGu) | Bjo) 
Bv) = Tg) * UG)? 


sendo que E(jw) = F(e(t)). Claramente, a segunda parcela da Eq. 3.42 
é devida ao ruído, e a única forma de garantir que tal parcela não afete 
Hjw) na equação acima é supor que e(t) = 0, Vt, ou que o ruído não tenha 
potência espectral na faixa de frequências de interesse, Tais considerações 
normalmente não são realistas. Como na Seção 3.5, tal dificuldade surge 
em consegiiência dos métodos usados serem determinísticos. 

No próximo capítulo será visto como o uso de funções de correlação e 
suas respectivas transformadas de Fourier podem ser utilizadas para reduzir 
o efeito da parcela E(jw)/U(jw). Vale a pena mencionar que, no caso de 
sinais discretos de duração finita, em vez da TF, usa-se a Transformada 
Discreta de Fourier (TDF), definida para um sinal y(k) com N amostras, 
como sendo (MITRA, 1998, p. 131) 


(3.49) 


N-1 
Vim) = Y (comu = Uh dot, n=0,...,N 1. 
k=0 


O uso da TDF de sinais na estimação de Fi(ei) resulta numa outra 
parcela, além de E(e!)/U (e!“), do lado direito de uma equação análoga à 
Eq. 3.42, conforme detalhado no Complemento 3.1. 


Exemplo 3.6.1. Estimação da resposta em fregiência (um caso simulado) 


A mesma função de transferência do Exemplo 3.5.1 foi excitada com 
um sinal semelhante ao mostrado na Figura 3.14a, mas com duração de 
128 amostras. A transformada discreta de Fourier desse sinal e de sua 
respectiva resposta y(k) foram utilizados para determinar H (eis), segundo 
(3.41). O número complexo H(eiti) = a-+jf é obtido dividindo-se Y (ei) 
por U(eis). O módulo e a fase são obtidos fazendo-se 


[H(ee) | 
fase[H (ei:)] 


Vo2+p 

el tar! [É | 
A resposta em fregiiência determinada usando-se (3.41) e a obtida dire- 
tamente a partir de H(z) são comparadas na Figura 3.16. O procedimento 


Digitalizado com CamScanner 


3.6 IDENTIFICAÇÃO NO DOMÍNIO DA FREQUÊNCIA 167 


fase de HGw) (graus) 


frequência (radis) 


FIGURA 3.16: Respostas em fregiiência “real” e identificada 


(a) ganho, e (b) fase das respostas em fregiiência do sistema origi- 
nal (traço contínuo) e estimada a partir de y(k) e u(k) (tracejado, 
ex351 0). 


usado no presente exemplo é sensível a problemas numéricos, principalmente 
em altas fregiências, conforme pode ser constatado no gráfico da fase de 
H(ju). o 


Exemplo 3.6.2. Estimação da resposta em fregiiência (um caso real) 


O presente exemplo se assemelha ao anterior. A diferença está no fato 
de que, neste exemplo, os dados utilizados foram coletados da planta piloto 
de bombeamento de água descrita na Seção 1.4. A entrada, u(k), é um 
sinal de 4 a 20mA que comanda o inversor de frequência que, por sua vez, 
alimenta a bomba. À rigor, o sinal registrado é um sinal de tensão entre 1 e 
5 volts. A conversão desse sinal para o sinal de corrente se dá dividindo-se 
o sinal original por 250. A saída, y(k), é um sinal de tensão de 0 a 5V 
e é representativo da vazão de saída. Esses sinais foram medidos por meio 
de uma placa de aquisição de dados ligada à instrumentação da planta. 
Assim, tais sinais serão apresentados nas unidades em que foram medidos 
(mA e volts), em vez de usar as unidades de engenharia das variáveis que 
representam. Outra diferença, com respeito ao Exemplo 3.6.1, está no tipo 
de sinal aplicado ao processo. Os sinais de entrada (um pulso) e saída usados 
no presente exemplo são mostrados na Figura 3.17. Uma forma simples de 
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gerar um pulso mais suave é u(t) = k(1 — coswt), sendo que os parâmetros 
k e w devem ser escolhidos de maneira a adequar o pulso de entrada u(t) 
ao processo sendo testado. 


100 zoo E] “o soo oo 700 


FIGURA 3.17: Resposta ao pulso 


(a) pulso de entrada, u(k), e (b) resposta de vazão da planta, y(k) 
(pulsoto 0). O sinal registrado no arquivo é um sinal de tensão 
entre 1 e 5 volts, A conversão desse sinal para o sinal de corrente 
se dá dividindo-se o sinal original por 250 9. 


Vale a pena mencionar dois aspectos importantes que são evidenciados 
na Figura 3.17. Em primeiro lugar, a variação do sinal de saída é rela- 
tivamente pequena comparada à faixa total de operação (menos de 0,1 V 
num fundo de escala de 5 V). O segundo ponto importante a se notar é que 
o teste dinâmico não começa com a planta “desligada”. Pelo contrário, a 
planta deve estar operando no ponto em torno do qual se deseja obter o 
modelo, Para ver isso na Figura 3.17, basta notar que nem a entrada nem 
a resposta estavam em zero no iníco do teste. 

Foram determinadas as transformadas de Fourier dos sinais u(k) e y(k), 
U (ei) e Y (ei), cujos módulos são mostrados na Figura 3.18, após o devido 
ajuste na escala de fregiiência (ver comentário no Complemento 7.2). Deve 
ser notado que tanto | U(ei) | quanto | Y (ei) | apresentam, em altas 
freqiências, valores irreais em função de dificuldades numéricas, de presença 
de ruído e possivelmente do fenômeno de falseamento — ou superposição de 
espectros — (aliasing) que surge devido ao desempenho não ideal do filtro 
anti-falseamento usado. 
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ta) 


cad 
282233 


w(radis) 


FIGURA 3.18: Módulos das transformadas de Fourier 
Módulos das transformadas de Fourier dos sinais de entrada e 


saída (a) |U(eiv)|, e (b) |Y (ei)| (pulso 0). 


A fim de estimar a resposta em fregiência da planta, pode-se usar (3.41), 
porém, com o cuidado de se utilizar as partes confiáveis de | U(ei) | e 
|Y (e/)|. Com esse fim, foram utilizados apenas os dados correspondentes 
até a fregiiência de w = 0,015 rad/s. 


ta) 


(o) 


10º 10º 10” 
w(radis) 


Figura 3.19: Resposta em fregiiência estimada 
Representação gráfica de À (ei»). (a) ganho, e (b) fase (pulso O). 
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Concluindo, a estimativa da resposta em fregiiência é obtida dividindo-se 
números complexos, fregiiência a fregiiência, para cada fregiência na faixa 
de interesse. O resultado é mostrado na Figura 3.19, que revela algumas 
características dinâmicas do processo com razoável clareza. O uso de H (e) 
na obtenção de modelos paramétricos e a interpretação do resultado obtido 
neste exemplo serão discutidos mais detalhadamente no Exemplo 4.6.1. O 


3.7 Complementos 


Complemento 3.1. Estimativa empírica de funções de transferência 


Seja o sistema estável de entrada limitada e saída limitada, H(z). No 
domínio do tempo, os sinais de entrada, u(k), e saída, y(k), desse sistema 
estão relacionados da seguinte forma: y(k) = H(g)u(k), sendo que q”! é o 
operador de atraso. 

Suponha que a entrada é desconhecida, mas limitada a 


[u(k) |< Cu k=12,... 


As transformadas discretas de Fourier de u(k) e y(k), U(ei*) e Y (ei) estão 
relacionadas da seguinte forma: 


Y(ev) = H()U (ei) + R(ei2), (3.43) 
sendo que E 
|R(eio)|< dam cem Cy = h(o]. (3.44) 


A prova de (3.43) pode ser encontrada em (LJUNG, 1987; VAN DEN 
BoscH; VAN DER KLAUW, 1994). 

Para sinais de entrada periódicos com período N, R(ei“) = 0, para 
frequências w = 27k/N, k = 1,...,N. Entretanto, para o caso geral de 
sinais de entrada que não sejam periódicos com período N, a Eq. 3.43 revela 
que, mesmo na ausência de ruído, a estimativa 


Yes) | R(eio) 


T = Ties) * Tt) 


é tendenciosa (devido ao segundo termo do lado direito da igualdade). 
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Da Eq.3.44 percebe-se que R(ei“) decai conforme 1/VN. Ou seja, 
R(eiº) — 0 à medida que N — 00, e, portanto, É (ei) aproxima-se de 
H (ei?) assintoticamente, isto é, à medida que N = oo. 

Para o caso em que o sinal de saída está corrompido com ruído, a relação 
entre os sinais de entrada e saída é dada por y(k) = H(g)u(k) + e(k), e a 
estimativa da resposta em fregiiência passa a ser 


arjo — Yi)  R(eiv) | E(eis) 
He = Trio) * U(oo) * D(eo)? 


(3.45) 


sendo que E(jw) é a transformada discreta de Fourier do ruído e(k). Deve 
ser notado que se o ruído tem média zero, então E[E(ei“)] = 0, Vw. Assim 
sendo, como será visto no fim do Capítulo 6, o terceiro termo do lado direito 
de (3.45) não resultará em nenhum erro sistemático na estimativa empírica 
da função de transferência À (ei). 

Um outro procedimento, análogo ao descrito acima, consiste em estimar 
a função de transferência da seguinte maneira: 


+ (UML ye 
He= DM a 
"CM Dur 


sendo que y;" é o k-ésimo coeficiente da série de Fourier da saída calculado 
usando-se o m-ésimo período de uma janela de dados com M períodos com- 
pletos. uz! é definido de forma análoga para a entrada. Claramente k indica 
a k-ésima freqiiência harmônica. Além disso, para usar a estimativa (3.46) 
é necessário que a excitação seja um sinal periódico com potência espectral 
nas k fregiiências harmônicas de interesse. De fato, tal procedimento faz 
uso de um sinal multi-senoidal para excitar o sistema a ser identificado. 
Esse estimador foi proposto originalmente por Guillaume e colaboradores 
(1992) e recentemente aplicado com sucesso a dados de uma turbina a gás 
em (EVANS et al., 2001). 


(3.46) 


Comentários Finais 


Neste capítulo foram descritos alguns métodos para a identificação deter- 
minística de sistemas dinâmicos lineares. A característica principal destes 
métodos é que nenhuma providência especial é tomada para tratar o ruído 
presente nos dados. Conseqiientemente, a aplicação dos métodos descritos 
se restringe aos casos em que o ruído é desprezível. Esta conclusão pode ser 
obtida analisando a Eq. 3.40. 
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Para sentir a dificuldade de tentar aplicar métodos determinísticos na 
identificação de sistemas a partir de dados fortemente corrompidos por ruf- 
do, considere a Pigura 3.20, 


4— eq r pasa T T 


FIGURA 3.20: Resposta ao degrau contaminada com ruído 


Resposta ao degrau da Figura 3.12, mas contaminada com ruído. 


Essa figura mostra a mesma resposta ao degrau da Figura 3.12, mas con- 
taminada com bastante ruído. Obviamente, a partir da Figura 3.20 torna-se 
praticamente impossível determinar as grandezas necessárias para aplicar 
o método descrito na Seção 3.4. O Exercício 3.17 mostra uma resposta ao 
degrau medida de um processo real, em que as próprias características do 
processo se refletem na medição na forma de oscilações de alta fregiiên- 
cia. Comparando-se as Figuras 3.20 e 3.27, percebe-se que em ambos os 
casos a aplicação de técnicas de modelagem determinísticas é grandemente 
dificultada. 

Ainda ilustrando o efeito do ruído em métodos determinísticos, consi- 
dere o Exemplo 1.3.2. Tomando os mesmos dados daquele exemplo, mas 
agora com ruído e repetindo o procedimento, chega-se ao seguinte resultado: 
(z1,y1 + e1) = (144,0;0,098 + 0,032) e (12,2 + e2) = (158,4; 0,109 + 0,005), 
sendo que e; são valores da variável aleatória e, que representa o ruído. 
Nesse caso, tem-se o seguinte sistema de equações: 


0,098 +0,032 ] [1 1440] [O 
E Aa 1584 || 6, | (ar) 


Portanto, 


Digitalizado com CamScanner 


LEITURA RECOMENDADA 173 


01]..[ 11,00 -10,00] [0,130]. [ 2872x10-1 
O» -0,069 0,069 || 0,114 | =| -1,091x10-3 |* (3.48) 


A reta resultante é mostrada na Figura 3.21 e percebe-se que, apesar 
de passar por dois valores medidos, a reta como um todo obviamente não 
representa a tendência dos dados. Essa falha é devido à sensibilidade do 
procedimento seguido, que é claramente determinístico, e à presença de 
ruído. 


Leitura Recomendada 


A identificação de modelos usando métodos determinísticos normalmente 
não recebe muita atenção na maioria dos livros textos. Mas é em arti- 
gos da literatura que muita informação útil sobre tais métodos pode ser 
encontrada. Rake (1980) discute a identificação da resposta em frequência 
e alguns métodos baseados na resposta ao degrau. Em particular, descreve 
métodos para obter modelos da forma 


o e 
í e Es o 
E E a » 


tensão de saída por volt de alimentação (VV) 


qu 41 
9 E 100 150 200 250 300 
graus angulares 


FIGURA 3.21: Reta determinada a partir de dados com ruído 


Dados medidos com ruído estão marcados com cruzes e o traço é 
a reta y = 2,872 x 10! — 1,091 x 10-3z. 


Kerta K 


HO) e rn * Bl) ER 


(rs + 1)? 3,49) 


Um outro trabalho discute a estimação dos parâmetros de funções de trans- 
ferência da forma Hi(s) a partir da resposta ao degrau (SKOCZOWSKI, 


Digitalizado com CamScanner 


Na 3 MÉTODOS DETERMINÍSTICOS 


1997). Arruda e Barros (2007) apresentam nove funções de transferência 
semelhantes a Hh(s) e Ha(s) e discutem um procedimento para estimar os 
respectivos parâmetros, 

Diversos artigos sobre sintonia de sistemas de controle discutem o pro- 
cesso de identificação (muitas vezes determinístico) e como sintonizar o 
controlador bascado no modelo identificado. Um exemplo é o artigo publi- 
cado por Yuwana e Seborg (1982), em que foi desenvolvido o método para 
identificação em malha fechada descrito na Seção 3.4. 

Shinskey (1988) descreve diversos conceitos muito úteis na identificação 
de processos usando, principalmente, entradas em degrau. Apesar de forte 
ênfase em processos químicos, os métodos discutidos podem ser aplicados 
a qualquer outro sistema, na maioria dos casos. Coelho e Barros (2002) 
abordaram o problema da identificação de modelos de primeira ordem com 
atraso puro de tempo a partir da resposta ao degrau de forma estocástica, 
utilizando o estimador de mínimos quadrados e o de variáveis instrumentais 
— a serem apresentados nos Capítulos 5 e 7, respectivamente. Diversos 
métodos determinísticos de identificação, apartir de dados em malha aber- 
ta e fechada, são apresentados em (COELHO; COELHO, 2004) Finalmente, 
Ljung (1987) apresenta a estimação empírica de funções de transferência no 
domínio da frequência de forma detalhada e completa sendo que Pintelon e 
colegas (1992) tratam do assunto também no domínio da fregiiência, mas 
assumem que o sistema está em malha fechada. 


Exercícios 


3.1. Descreva os principais cuidados e procedimentos na identificação de sis- 
temas utilizando métodos determinísticos. Na sua resposta aborde aspectos 
tais como: o que são métodos determinísticos, situações em que tais mé- 
todos são aplicáveis, tipos de modelos normalmente identificados por tais 
métodos, projeto e execução de testes, procedimentos, e assim por diante. 


3.2, Utilize a Eq. 3.10 para estimar a constante de tempo a partir da res- 
posta ao degrau nos seguintes casos 


H(s) = H(s) = 


1d, 
25+1' 


3.3, A Figura 3,22 mostra a resposta simulada de um sistema, que opera em 
malha aberta, a uma entrada em degrau de amplitude unitária. Proponha 
funções de transferência como modelos para esse sistema. Quantos modos 
são necessários para representar esse sistema? Por quê? Note que as funções 
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de transferência propostas podem ser aproximadas, ou seja, não precisam 
ter os mesmos modos, nem sequer o mesmo número de modos indicados na 


sua resposta à pergunta acima. 


FIGURA 3.22: Resposta ao degrau para exercício proposto 
Resposta ao degrau do sistema hipotético do Exercício 3.3, 


1 E ss e 
o 5 10 15 20 2s so as so as so 
(o) 
15 
| 
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FIGURA 3.23: Resposta ao degrau de sensor de temperatura 


Resposta de RTD (PT100) a degraus de temperatura (a) degrau 
positivo (rtdp O), e (b) degrau negativo (rtdn 0). 
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3,4, À Figura 3.23 mostra as respostas a degraus positivos e negativos de 
um sensor de temperatura. 

Obtenha modelos matemáticos para ambos os casos, considerando-se 
que o sistema não tem atraso puro de tempo apreciável (uma consideração 
realista no presente caso) e que os degraus de entrada foram de 70º e - 
20º, respectivamente. Discuta as possíveis razões para diferenças entre 
tais modelos. Aproximadamente, quantas constantes de tempo (modos) 
podem ser observadas na resposta? Tente imaginar e descreva como foi a 
realização do teste que gerou os dados mostrados na figura. Baseado no seu 
conhecimento sobre transmissão de calor, explique a ocorrência de mais de 
uma constante de tempo (lenta) nesse sistema. 


3.5. Seja a seguinte função de transferência para um processo hipotético 
(Yuwana; SEBORG, 1982): 


er! 
Ho) = rr + Os FT 
Simule a resposta ao degrau unitário da malha fechada desse sistema com 
um controlador puramente proporcional. Caso deseje, aproxime o atraso 
puro de tempo usando (2.20). Siga o procedimento da Seção 3.4 e identifique 
um modelo do tipo (3.23), para o “processo” H(s) acima. Compare as 
respostas ao degrau de H(s) e do modelo identificado. 


3.6. Considere a expressão (3.30), que requer A  yoo: Comente em que 
situações práticas ter-se-á 4 = yo: Dada uma situação prática em que 
se verifique À = Yo, como procederia para aplicar o método descrito na 
Seção 3.4? 


3.7. Utilize a Eq. 3.35 para estimar o ganho a partir da resposta ao degrau 
nos seguintes casos: 


E Leça = 2 
Ho) 82 +0838+1' je 2+028+1,5' 


Neste exercício, use apenas três ciclos da resposta subamortecida. 


3.8, Em diversos métodos de identificação de sistemas lineares é comum 
subtrair dos sinais medidos os valores que tinham logo antes de se execu- 
tar o teste em questão (ver o Exemplo 3.4.1). Discuta a razão para isso. 
Considere os dados desse exemplo (mf644 Q) e verifique que esse cuidado 
foi tomado ao estimar os valores ali apresentados. Discuta quais outros 
cuidados precisam ser tomados ao se simular o modelo resultante a fim de 
contextualizar o resultado com os dados originais. | 
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3.9. Mostre que para um sistema discreto, linear e estável com resposta ao 
impulso A(k), tempo de amostragem T; e tempo de acomodação Ta = kaTs, 
h(k) = 0, Vk > ka. Ou seja, mostre que 


o ka 
vt) =D MoJulk=5)=55 hliJu(k — 5). 
j=0 j=0 


3.10. Utilize a Eg.3.38 para estimar os primeiros dez valores da resposta 
ao impulso de 


PES 4 (9 a 
He) = Tia)" dra ros 


nos seguintes casos: 1) use uma entrada aleatória; 2) use como entrada um 
impulso; 3) repita os casos acima, mas adicionando um sinal aleatório a y(k) 
com 5% da amplitude do sinal. Discuta os seus resultados e as principais 
dificuldades de se usar a Eq. 3.38 na identificação de sistemas reais. 


3.11. Repita o procedimento do Exemplo 3.6.2, mas agora usando os dados 
pulso30 O mostrados na Figura 3.24. Esses dados foram obtidos a partir 
de um outro teste feito na mesma planta. Indique as principais diferenças 
observadas e discuta as possíveis razões para tais. Não se esqueça de que no 
arquivo pulso30 (O os dados foram gravados em volts e no exemplo referido 
utilizou-se o sinal em corrente. À conversão se dá dividindo-se o sinal de 
tensão por 250 2. 


3.12, Usando os dados no arquivo ens.25 Q, proponha um modelo (ou 
mais) para a planta de bombeamento descrita na Seção 1.4. Note que 
tais dados são a resposta do sistema a um degrau de corrente de 16,34mA 
para 17,05mA. Discuta as vantagens e desvantagens dos modelos propostos 
quando comparados ao modelo obtido na Seção 1.4. 


3.13, À Figura 3.25 mostra a resposta da planta de bombeamento descrita 
na Seção 1.4 a uma entrada senoidal de fregiiência 0,01 rad/s. As unidades 
dos sinais em questão são volts (sendo que o sinal de entrada é convertido 
de uma escala de 1V a 5V para uma de 4 a 20mA antes de ser enviado 
ao inversor de frequência). Procure verificar se a resposta em freqiiência da 
Planta estimada e mostrada na Figura 3.19 está de acordo com as medições 
da Figura 3.25. Quais são as dificuldades de se fazer esta constatação na 
prática? 
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FIGURA 3.24: Resposta ao pulso para exercício proposto 


(a) pulso de entrada, u(k), e (b) resposta de vazão da planta, y(k) 
(pulso30 0), do Exercício 3.11, 


Ed 1 ne 
500 600 700 800 900 1000 


FIGURA 3.25: Resposta senoidal da planta de bombeamento 


Resposta da planta de bombeamento a uma senóide de fregiência 
0,01 rad/s. 


3.14. Usando o método de Sundaresan, obtenha um modelo para a malha 
fechada do sistema considerado no Exemplo 3.4.1. 
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3.15. A partir do modelo obtido no Exercício 3.14, sabendo-se que o teste foi 
executado com o controlador puramente em proporcional, Kc = 2, obtenha 
um modelo para o processo. Considere realimentação unitária. Discuta em 
que situações práticas a consideração acima será válida. 


3.16. A Figura 3.26 mostra a resposta em malha fechada do mesmo processo 
considerado no Exemplo 3.4.1. 


FIGURA 3.26: Figura para exercício de resposta em malha fechada 


Resposta em malha fechada de um processo real. O sinal em 
degrau é a referência da malha, ao passo que o outro sinal é a 
variável controlada (mf644 O). 


Use o método descrito na Seção 3.4 para obter modelos em malha aberta 
para o processo em questão a partir dos dados da Figura 3.26. Simule os 
modelos em malha fechada usando um controlador puramente proporcional 
Kc = 2, valor para o qual foi executado o teste. Faça ajustes, se necessário, 
para melhorar o desempenho do modelo. Justifique seu procedimento e 
comente seus resultados. 


3.17. Considere a resposta ao degrau mostrada na Figura 3.27. O sinal 
mostrado é a diferença de pressão medida na saída de um tubo de Pitot 
localizado na tubulação de adução de um conjunto turbina-gerador durante 
uma mudança de potência gerada (de 5MW para 6MW). O elevado ní- 
vel de “ruído” nesses dados não é, na sua maior parte, devido ao ruído de 
medição, mas sim ao próprio escoamento, que no presente caso é turbu- 
lento. Desprezando-se qualquer atraso puro de tempo e supondo-se que o 
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degrau foi unitário, proponha um modelo para o processo. Use um método 
determinístico. 


1100) Ta SS ORa O SS | 


1000) 


º zo “o 100 120 mo 


e so 
tompo(s) 
FIGURA 3.27: Resposta ao degrau medida em processo turbulento 

Dados disponíveis em (ensaio6mw 0). 
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Métodos Não-Paramétricos 


4.1 Introdução 


Este capítulo aborda métodos de identificação não-paramétricos. Métodos 
não-paramétricos são aqueles que não resultam em um modelo matemático 
tal como uma função de transferência, mas sim numa representação gráfica 
que caracteriza a dinâmica do sistema em estudo. Exemplos típicos de tais 
representações são a resposta ao impulso e a resposta em fregiência. A partir 
de uma dessas respostas é possível determinar modelos paramétricos com 
características semelhantes, como será mostrado no Complemento 4.2. Se 
o objetivo final for obter um modelo para, por exemplo, simular o sistema, 
então, métodos paramétricos podem ser utilizados diretamente. 

Apesar dos métodos descritos a seguir serem viáveis na prática, este 
capítulo não deve ser visto apenas como um fim em si mesmo. Ao contrário, 
este capítulo será útil para apresentar conceitos e chamar a atenção para 
problemas presentes também na identificação de modelos paramétricos. 


4.2 Reduzindo o Efeito de Ruído no Domínio do 
Tempo — Funções de Correlação 


Nos dados coletados em qualquer experimento real haverá ruído. Em muitas 
situações o ruído pode ser desprezado sem maiores problemas. A maioria 
dos métodos determinísticos de identificação é bastante sensível a ruído 
(veja o exemplo ao fim do capítulo anterior) e, portanto, faz-se necessário 
desenvolver métodos mais elaborados para diminuir os efeitos nocivos do 
ruído. Os métodos não-paramétricos descritos neste capítulo têm um certo 
grau de robustez ao ruído, não por serem não-paramétricos, mas por serem 
estocásticos. A fim de entender como a robustez ao ruído é conseguida, 
considere o seguinte exemplo. 
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Exemplo d,2.1, Redução do efeito de ruído 


Uma forma comum de reduzir os efeitos de ruído nos dados é tirando a 
média (averaging) de dados correspondentes a ensaios que sejam tão simi- 
lares quanto possível. Esse procedimento é conhecido como acumulação de 
amostras. Considere os dados mostrados na Figura 4.1a. Tal sinal foi gerado 
por simulação e a ele foi adicionado uma certa quantidade de ruído branco. 
Esse tipo de ruído é caracterizado por possuir potência espectral em todas 
as frequências ou, alternativamente, possuir uma função de autocorrelação 
nula para todos os atrasos fora da origem, conforme será discutido com mais 
detalhes na Seção 4.3. 


víre(o 


(o) 
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FIGURA 4.1: Redução do efeito de ruído 


Redução do efeito de ruído aleatório ao se tirar a média de sinais de 
testes similares. (a) uma realização do teste, (b) média resultante 
de cem testes semelhantes ao mostrado em (a). Esse procedimento 
é também conhecido como acumulação de amostras. 


O gráfico da Figura 4.1b foi obtido tirando-se a média de um conjunto 
de 100 simulações independentes, semelhantes à mostrada na Figura 4.la. 
Ou seja, não se trata de tomar a média temporal. Em cada simulação, 
o mesmo modelo foi utilizado, mas a realização do ruído era diferente, ou 
seja, apesar de tomar valores de ruído sempre com a mesma distribuição de 


j 
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probabilidade, os valores adicionados ao sinal determinístico (simulação do 
modelo) eram diferentes, Teoricamente, o efeito do ruído poderia ser total- 
mente eliminado se a média fosse tirada utilizando-se um número infinito 
de simulações. 


Esse procedimento se baseia na pressuposição de que o ruído é aleatório 
com média zero, ou seja, o ruído é branco e, portanto, não consistente. Além 
disso, assume-se que o processo é ergódico.! Portanto, os efeitos do ruído 
tendem a se cancelar, uma vez que o ruído não tem nenhuma tendência. 
Por outro lado, aquilo que é consistente nos dados, isto é, a parte deter- 
minística do sinal, que contém a informação sobre a dinâmica do processo 
a ser identificado, é preservada pelo processo de média. Comparando-se as 
Figuras 4.1a e 4.1b, nota-se que os efeitos do ruído no segundo gráfico são 
sensivelmente menores. 0 


A justificativa para o aumento da relação sinal/ruído acima pode ser 
entendida da seguinte forma. Seja a k-ésima amostra do sinal com ruído 
y(k) com desvio padrão o. Um conjunto de N, simulações dá origem a Ns 
amostras na posição k, (yi(k);ya(k),... syn,(k)) com média y(k). A barra 
abaixo de y(k) indica que a média foi tomada a partir de várias realizações 
em vez da média temporal. Deve estar claro que a k-ésima amostra no 
gráfico 4.1b é precisamente y(k). Ou seja, tal gráfico é o resultado da 
média, ponto a ponto, de N$ simulações independentes, porém realizadas de 
forma idêntica. 


A média das Ns simulações é 


Ns 
O) = 7 Dub) = 1, (41) 


i=1 


sendo que N indica o número total de amostras. No Exemplo 4.2.1, esse 
número pode ser determinado dividindo-se a duração da simulação, 30 uni- 
dades de tempo, pelo período de amostragem. Portanto, pode-se escrever 
(ver Propriedades C,2.4 e C.2,5) 


"Esta é uma suposição mais técnica que permite que a média seja tirada entre diversas 
realizações ao invés de se tomar a média no tempo e vice-versa. Em outras palavras, 
a esperança matemática pode ser substituída pela média temporal. 
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var[y(k)] 


vala (un (4) + va(k) +. + um (6))] 


= navio (6) + ya(k) +... + yn,(k)] 
E 5 (vaty (6)] + varfya(6)] .. varfyn, (6)]) 
o? 2 
= a = (4.2) 


A equação (4.2) mostra que o desvio padrão da k-ésima amostra do sinal 
resultante do procedimento de média, /var(y(k)] =o0/VNs, é menor que o 
desvio padrão da respectiva amostra no sinal original. 

O procedimento descrito no Exemplo 4.2.1 funciona, desde que o ruído 
seja branco. Entretanto, tal método não é viável na maioria dos casos 
práticos, uma vez que é muito difícil, ou até mesmo impossível, realizar o 
mesmo teste muitas vezes. O objetivo desse exemplo foi chamar a atenção 
para o fato de que o processo de tirar a média de sinais contaminados com 
ruído reduz a componente puramente aleatória do sinal. Essa característica 
também estará presente em outros métodos a serem estudados ao longo 
deste livro. 


4.2.1 Identificação baseada em funções de correlação 


O objetivo nesta seção é usar funções de correlação para estimar a resposta 
ao impulso do sistema, h(t). Uma vez que o resultado esperado é a re- 
presentação gráfica de h(t) e não um modelo paramétrico, o procedimento 
descrito a seguir se enquadra nos métodos de identificação não paramétrica. 

A função de correlação cruzada (FCC) entre dois sinais u(t) e y(t) é 
definida como 


rulrt) = Elu()y'(t+7)] (4.3) 


a 
ralo) = mess |  uult+rd, 


sendo que o processo foi considerado real, nesse caso y* (t) = y(t); o processo 
foi considerado ergódico, a fim de poder substituir a esperança matemática 
E[:| pela média temporal; e assumiu-se estacionariedade, para eliminar a de- 
pendência da função de covariância cruzada com o tempo. Essas definições 
podem ser encontradas no Anexo C. 
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Uma maneira de estimar a função de correlação cruzada a partir de 
séries discretas no tempo é 


N 
rol) = im, ama DO cti+ (44) 


sendo k um número inteiro e, na prática, N deve ter um valor elevado. De 
forma análoga, a função de autocorrelação (FAC) de um sinal u(t) pode ser 
estimada usando-se 


1 N 
Tuu(k) = 


aim NII. uliu(i + k). (4.5) 
i=-N 
Outras definições relacionadas à FCC e FAC é a função de covariância 
ou de covariância cruzada, definida como 


Cuylmt) = Cov[u(t) y(t + 7)] = El(u(t) = u)(y'(t+ 7) = 9%], (4.6) 
ea função de autocovariância 


Cuu(Tit) = Cov[u(t),u(t + 7)] = El(u(t) — u)(u*(t + 7) — 0º). (4.7) 


Em identificação de sistemas, devido à forma com que os testes e coleta 
de dados são efetuados, os sinais são sempre reais e, além disso, normal- 
mente trabalha-se com sinais de média nula. Em tais casos, as funções de 
autocorrelação e correlação cruzada coincidem com as funções de autocova- 
riância e covariância cruzada, conforme pode ser visto das Definições C.1.7 
e C.1,9 (ver Exercício 4.3). Portanto, no presente livro, os termos autocor- 
relação e correlação cruzada serão usados ainda que, a rigor, as denomina- 
ções autocovariância e covariância cruzada sejam mais adequadas. Deve 
ser mencionado que outros autores (principalmente de textos de séries tem- 
porais) definem a função de autocorrelação como sendo a autocovariância 
normalizada pela variância (KOHN, 2006). 

Define-se também o coeficiente de correlação entre as variáveis u e y 
como sendo p(u,y) = Cov[u,y]/(ou oy), sendo ou O desvio padrão de u e 
oy define-se de maneira análoga. Aqui não se usou o argumento de tempo, 
pois normalmente u e y serão séries temporais. Se nessa definição as séries 
forem u(k) e u(k + 7), ter-se-ia o coeficiente de correlação em função do 
deslocamento 7, Pu,u(T), que, às vezes, recebe o nome de função coeficiente 
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de correlação. Essa função é fregilentemente referida como função de auto- 
correlação em textos de séries temporais. A função de correlação cruzada é 
definida analogamente em tais textos. 

No caso prático de séries temporais de duração finita, ruu(k) pode ser 
estimado utilizando-se 


N-k 
Puulh) = 5 Dulidu(i+h) k=01,.0;N-1 (48) 


i=l 


A função de autocorrelação amostral fuu(k) é um estimador consistente 
da função de autocorrelação ruu(k). Semelhantemente, a FCC amostral de 
duas séries temporais de média nula u(k) e y(k) é 


+ONTulidyli +), k=0,1,...,N-1 
Puylk) = (4.9) 


PNR yliu(i — k), k=0,-1,...0,-N+1L 


A função de correlação cruzada amostral fuy(k) é um estimador consis- 
tente da função de correlação cruzada ruy(k), pois a primeira aproxima-se 
da segunda (em algum sentido) à medida que N = oo É importante notar 
que se u(k) e y(k) não tiverem média nula, a respectiva média (amostral) 
deve ser subtraída antes de utilizar os estimadores em (4.8) e (4.9). A re- 
levante questão dos intervalos de confiança da FAC e FCC é discutida na 
Seção 4.3. 

No restante do livro, por simplicidade, será omitido o termo amostral. 
Contudo, pelo contexto, será evidentente que a menção é a uma estimativa 
amostral das FAC e FCC. 


Exemplo 4.2.2. FAC de um processo MA ? 


Seja o processo MA e(k) = Si(A — 1) + v(k), sendo v(k) uma variável 
aleatória, branca, de variância oi, A FAC de e(k) pode ser determinada, 
assumindo-se estacionariedade, usando-se | 


rel) = Ele(k)e(k +7)]. 


A FAC de e(k) pode ser determinada como 


2NoRTON, 1986. p. 95. 
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re(O) = E [(ci(k — 1) +v(6))?] 
= El(A)?] + ciBlu(k — 12] = (1 + ci)ol, 

reell) = El(c(k = 1) + v(k)) (crv(k) + v(k + 1))] 
= aElY(k)?) = cos, 

reelr) = El(cu(k=1)+v(k)) (cu(k = 1+7) +v(k+7))) 
= 0Vr>1. 


No desenvolvimento anterior, a esperança matemática de alguns produtos 
cruzados era nula. Como será visto mais adiante, isso é uma consegiiência 
de algumas propriedades de ruído branco e de sinais aleatórios. [a] 


Exemplo 4.2.3. FAC de uma senóide 
Seja u(t) = Asen(wt + &). A função de autocorrelação desse sinal é: 


ruulT) = Elu(t)u(t+7)] 
T 
jim = [eu + rd 


O a ) 
= dm /,A sen(wt + q)sen(wt + wr + dt 


e Ef RAS 
= Jim, = / AT [cos(w7) — cos(2wt + wr + 29)]dt 


= a APcos(um) 


Torna-se claro que a função de autocorrelação possui o mesmo período que 
a função original, De fato, essa propriedade não se limita apenas a sinais 
senoidais, pois a FAC de qualquer sinal periódico é também periódica, com 
o mesmo período, [n| 


A função de correlação entre dois sinais é uma medida da dependência 
temporal entre eles, Se tais sinais forem independentes (no tempo), a função 
de correlação cruzada será pequena (estatisticamente zero) para todos os 
valores do atraso 7 e diz-se que os sinais são não correlacionados. Em 
outras palavras, a FCC definida na equação (4.3) é uma medida de quão 
relacionados (no tempo) estão os sinais y(t + 7) e u(t), para diferentes 
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valores do defasamento 7. Em particular, e = ruy(7)/ruu(0) é o valor de a 
que minimiza Bl(o u(t) — y(t + 7))?) (ver Exercício 4.1). 


Exemplo 4.2.4, Detecção de correlação em meio ao ruído 


Considere os sinais u(k) = Acos(wk)+e(k) e y(k)=Asen(wk)-+v(k), 
w = laxrad, k=0,1,2...,em que e(k) e v(k) são variáveis aleatórias não 
correlacionadas com média nula. A Figura 4.2 mostra trechos dos sinais 
u(k) e y(k). A duração das janelas de dados corresponde aproximadamente 
a dois e meio “periodos” das funções seno e cosseno, usadas para gerar u(k) 
e y(k). Devido ao ruído, não há qualquer correlação óbvia entre esses sinais. 
Deve-se notar que as funções discretas acima não são periódicas, pois 27/w 
não é um número inteiro. 


=8 


FIGURA 4.2: Sinais correlacionados entre si com ruído 


Trechos dos sinais y(k) (superior) e u(k) (inferior) do Exem- 
plo 4.2.4. Devido ao ruído, os sinais parecem descorrelacionados. 


Tomando trechos correspondentes a cingiienta ciclos dos sinais u(t) e 
y(t), e determinando a FCC, ruy(7), 7 = 0,1,... ,150, verifica-se que os 
dois sinais são correlacionados, como pode ser observado na Figura 4.3. 

Ainda com relação à Figura 4.3, percebe-se que a correlação é aproxima- 
damente periódica com “período” em torno de 40 atrasos, ou seja, O atraso 
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é de 40r. Essas observações eram esperadas, uma vez que a parte deter- 
minística dos sinais u(k) e y(k) são funções cosseno e seno com “período” 
2m/w x 39,5. 

O presente exemplo ilustrou como o uso da FCC revelou a correlação 
existente entre dois sinais imersos em ruído. Tal correlação não é evidente 
se os sinais forem analisados conforme feito na Figura 4.2. A robustez com 
respeito ao ruído é uma das características desejáveis da FAC e da FCC, o 
que as recomenda em problemas de identificação de sistemas. [a] 


lag 


FIGURA 4.3: Função de correlação cruzada amostral de sinais com ruído 


FCC (amostral) entre u(k) e y(k). Os sinais são correlacionados, 
A faixa indicada com linhas tracejadas é a faixa de confiança de 
95% e será discutida na Seção 4.3. 


Exemplo 4.2.5. Estimação de tempo morto usando a FCC 


As propriedades da FCC motivam o uso da mesma para a estimação de 
tempo morto. No Capítulo 3 foram vistos exemplos em que o tempo morto 
era estimado a partir da simples observação da resposta ao degrau do siste- 
ma. Esse procedimento pressupõe que o ruído é suficientemente baixo para 
permitir detectar com certa precisão o instante em que o sistema começa a 
responder ao degrau aplicado à sua entrada. Em casos que o ruído é signifi- 
cativo, o procedimento determinístico descrito no capítulo anterior torna-se 
inadequado. Assim, um procedimento estocástico é requerido. Uma forma 
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simples de estimar o tempo morto é usar a FCC entre os sinais de entrada 
e saída e tentar observar onde se dá o máximo, 

Para ilustrar o uso da FCC, foi simulado um sistema de segunda ordem 
com K = 0,8; ( = 0,8; wn = 2rad/s e com tempo morto de 7q = 5 segundos. 
À resposta ao degrau desse sistema foi adicionado ruído branco com desvio 
padrão ce = 0,8. Nesse caso, a resposta do sistema fica imersa no ruído 
e torna-se muito difícil estimar 74 como feito no capítulo anterior. Um 
procedimento alternativo é calcular a FCC da saída e a entrada. No presente 
exemplo, isso foi feito em dois casos: para a entrada em degrau e para 


uma entrada com características aleatórias. Os resultados são mostrados 
na Figura 4.4, 


-05- 1 
E N E | 
=1s0 =100 = 0 so 100 150 

atrasos 


FIGURA 4.4: Funções de correlação cruzada amostral 


Uma estimativa grosseira do tempo morto pode ser obtida usando 
a FCC amostral entre saída e entrada do sistema. No presente 
exemplo: (a) entrada em degrau, e (b) entrada pseudo-aleatória 
(ver Seção 4.3). 


Da Figura 4.4 pode-se concluir que para a resposta em degrau é difícil 
estimar qualquer atraso no sistema, ao passo que para a entrada com ca- 
racterísticas aleatórias, a FOC tem um valor máximo evidente em torno do | 
atraso 58, que corresponde a um tempo de 5,8 segundos. Apesar de bastan- 
te simples e muito robusto ao ruído, o presente procedimento depende das 
características do sinal de entrada e é fortemente influenciado pela dinâmi- 
ca do sistema. Na realidade, a estimativa obtida conforme ilustrado acima 
inclui, além do tempo morto, informação sobre o tempo de acomodação 
do sistema. Consegientemente, este procedimento sempre estima valores 
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As funções de correlação definidas em (4.5) e (4.4) são úteis em identifi- 
cação de sistemas por dois motivos. Em primeiro lugar, é claro que a FCC 
e a FAC são relativamente robustas a ruído, tendo em vista o “efeito de 
média” (averaging) presente em suas definições. Como visto na seção ante- 
rior, tal característica tende a diminuir os efeitos do ruído, principalmente 
quando este for branco. 

A fim de apreciar o segundo motivo pelo qual ruu(k) e ruy(k) são úteis 
em identificação de sistemas, será vantajoso lembrar que a resposta y(k) de 
um sistema a uma entrada u(k) é dada pelo somatório de convolução 


Wk+)=5 Mliu(k+i— 5), (4.10) 
j=0 


sendo h(j) a resposta ao impulso do sistema no instante j. Substituindo-se 
a equação (4.10) em (4.4) e tomando-se o somatório para N=0a N=00, 
obtém-se após algumas manipulações (ver Exercício 4.7) 


ru) = 3 Miruulk — 1), (4.11) 
i=0 


ou seja, as funções de correlação ruu(k) e ruy(k) são relacionadas pela res- 
posta ao impulso do sistema, h(k), à semelhança de u(k) e y(k). A relação 
(4.11) é a equação de Wiener-Hopf. 

O desenvolvimento a seguir é análogo ao da Seção 3.5. A equação (4.11) 
representa um conjunto de equações que pode ser escrito da seguinte forma: 


ruy(O) = h(O)ruu(0) + MDruu(—1) +... 
ruyll) = h(O)ruu(1) + MAD ruu(O) + 
ruy(2) = h(O)ruu(2) + h(Druu(1) +... 


e 


que pode ser expressa em forma matricial como se segue: 


ruy(0) ruu(O) Tuu(=1) ...] [ h(0) 
ruy(1) Tuu(1) Tuu(0) .. h(1) 
Tuy(2) = TuulO) <Paull) uso h(2) |» 
Tuy = Ruuh. (4.12) 
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A solução de (4,12) é normalmente difícil uma vez que a matriz Ryu é de 
grande dimensão. Deve-se notar que (4.12) requer que ruy € Ruu não sejam 
normalizados. A matriz Ruy é conhecida como a matriz de covariância de 
u(k) (ver Exercício 4.10). Esse tipo de matriz será de grande utilidade em 
capítulos subsequentes. 

Da expressão (4.12) obtém-se: h = Rylruy, desde que Ryu seja bem 
condicionada. Essa solução é bastante geral no sentido de que não pressu- 
põe uma entrada específica. Contudo, se u(k) for “suave”, tal solução não 
será satisfatória em geral (ver Exercício 4.17). O termo “suave” é muito sub- 
jetivo. Uma maneira de quantificar quão suave é u(k) é verificar o quanto 
sua FAC se afasta da FAC de um ruído branco, conforme será discutido na 
Seção 4.3. 

Escolhendo-se u(k) tal que ruu(k) = 0, Vk £ 0, a Eq. 4.12 simplifica-se, 
pois Ruy Será diagonal com todos os elementos idênticos e a Eq. 4.12 poderá 
ser escrita como 


Ty = Tuu(0)I h, 
h = ru/oi, (4.13) 


sendo que 02 = ruu(0) é à variância do sinal u(k). À semelhança do que foi 
feito na Seção 3.5, será considerado o ruído nos dados medidos. Assim, o 
sinal medido será representado como a soma de uma parcela ideal e o ruído, 
isto é, y(k) = y'(k) + e(k). Como a Eq. 4.13 não depende explicitamente de 
y(k), tal variável pode ser substituída na Eq. 4.4, resultando em 


N 
> u(idly'(i+k) + eli+h)] 


Bag 
Pb) E O NEL di 
Leo [ E N 
= N AVAId fa 
= dN+i PRO! (i+h)+ Sá ulide(i + 4) 
= Tuyi(k) + ruelk). (414) 


Finalmente, substituindo ruy(k) da Eq. 4.14 em (4,13), e usando notação 
vetorial, obtém-se 


Fuyi + rue = Tuu(0)Ih, 


o Tui p ue 
h= tg (4.15) 
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O uso da notação vetorial aqui objetiva enfatizar que algumas das grandezas 
na última equação são vetores determinados a partir de dados, conforme 
pode ser visto na Eq.4.12. A Eq.4.15 é análoga à Eq. 3.40, e foi obtida 
partindo-se da equação de Wiener-Hopf (Eq. 4.11), em vez de se usar o 
somatório de convolução. Da mesma forma, observa-se que, aumentando- 
se a variância do sinal de entrada (essa é uma forma de se aumentar a 
relação sinal/ruído), a contribuição da segunda parcela na Eq. 4.15 diminui. 
O denominador da primeira parcela também aumenta, mas como y'(k) é 
conseqiiência do sinal de entrada, a contribuição relativa da primeira parcela 
aumenta. Esta análise está de acordo com a intuição de que, se forem usados 
sinais de maior amplitude durante os testes, a importância relativa do ruído 
diminui. Infelizmente, na prática essa forma de diminuir o efeito do ruído 
é limitada pelo fato de que normalmente não é possível, nem aconselhável 
(por motivos de segurança), usar sinais de amplitude elevada, uma vez que 
o sistema sob teste poderá excursionar por uma ampla faixa de operação, 
tornando difícil descrever seu comportamento com um modelo linear. 

A Eq.4.15 mostra que, ao contrário de(3.40), uma forma de eliminar 
o efeito da parcela devida ao ruído é garantir que rue(k) = 0, Vk. Essa 
condição é muito menos restritiva do que a condição análoga e(k) = O 
para o caso determinístico (Eq. 3.40). Tal condição deve ser observada em 
identificação de sistemas em geral e não apenas ao se utilizar as funções de 
correlação. Situações práticas em que rue(k) f O incluem a execução de 
testes em malha fechada (ver Exercício 4.11b) e a indução de ruído (pela 
mesma fonte) tanto na ação de controle quanto na variável controlada. 

Atingiu-se, portanto, o objetivo que era o de obter h(t) a partir de 
funções de correlação. Isso tanto pode ser conseguido resolvendo-se (4.12), 
quando Ryu for quadrada e não-singular, ou, resolvendo-se (4.13) nos casos 
em que o sinal de excitação u(k) tiver uma função de autocorrelação tal que 
Tuu(k) = 0, Vk £ O. Obviamente, a resolução da última equação é mais 
fácil e deve ser preferida à Eq. 4.12. 

Portanto, é importante saber quais os tipos de sinais que têm a pro- 
priedade ruu(k) = 0,Vk £ O. É possível verificar que sinais aleatóri- 
os ou pseudo-aleatórios têm funções de autocorrelação que se aproximam 
de um impulso de amplitude unitária localizado em k = 0. Sinais não- 
autocorrelacionados, como o ruído branco, satisfazem ruu(k) = 0, Vk £ 0, 
mesmo sem exigir que u(k) e u(k +77) sejam independentes para 7 £ 0. No 
caso de sinais puramente aleatórios, que é uma definição restritiva, requer 
que u(k) e u(k + 7) sejam independentes. Nesse caso ryu(k) = 0,Vk £ O 
será uma consegiência. Ao longo do livro, sinais tipo ruído branco serão 
referidos como sinais aleatórios. 
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Exemplo 4.2.6, Estimação estocástica da resposta ao impulso 


O presente exemplo ilustra o uso da Eq. 4.13 na estimação da resposta 
ao impulso. A Eq. 3.39 não tem como lidar com o ruído que aparece nas 
medições por ser determinística. Por outro lado, a Eq. 4.13 é mais robusta 
à presença do ruído devido ao uso da função de correlação cruzada, ruy(K). 


A mesma função de transferência do Exemplo 3.5.1 foi simulada para 
uma entrada, u(k), pseudo-aleatória (ver Seção 4.3). No presente exemplo, 
ruído com variância o2 = 1 x 1071 foi adicionado a y(k), ou seja, 10.000 
vezes maior do que a do ruído usado no Exemplo 3.5.1. A Figura 4.5 mostra 
a resposta ao impulso estimada a partir da função de correlação cruzada 
entre u(k) e y(k). A FAC de u(k) é mostrada na Figura 4.6a e a FCC de 
u(k) com o ruído adicionado aos dados pode ser vista na Figura 4.6b. 


FIGURA 4.5: Resposta ao impulso estimada 


Resposta ao impulso (o) original e (+) estimada. O traço contínuo 
foi adicionado a fim de facilitar a visualização (ex421 0). 


Deve ser notado que o sinal de entrada utilizado satisfaz à condição 
Tuu(k) = 0, Vk £ 0, isso permitiu o uso de (4.13), em vez de (4.12). Outro 
aspecto importante a se notar é que o ruído no presente exemplo não é 
desprezível como requerido por métodos determinísticos. Por se tratar de 
um método estocástico, a exigência é que rue(k) = 0, Vk, o que pode ser 
facilmente verificado a partir da Figura 4.6b. Lo 
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FIGURA 4.6: Funções de correlação na estimação de h 


(a) FAC de u(k), ruu(k), (b) FCC entre u(k) e e(k), rue(k). Os 
intervalos de confiança serão vistos na Seção 4.3 (ex421 0). 


4.3 Sinais Aleatórios e Pseudo-aleatórios 


Na seção anterior foi visto que, se a entrada de um determinado sistema 
for um sinal aleatório com variância o2, a resposta ao impulso de tal sis- 
tema pode ser obtida com relativa facilidade a partir de sua variância e de 
Tuy(k). A vantagem da entrada ser aleatória foi ilustrada do ponto de vista 
numérico, ou seja, o uso de sinais aleatórios para excitar a planta impli- 
ca reduzir a matriz Ryu, na Eg.4.12, para ruu(0)I, cuja inversa pode ser 
determinada com grande facilidade (ver Eq. 4.13). Tal simplificação é uma 
consegiiência direta da forma simples da FAC do sinal de entrada, que é 
Tuu(k) =0, Vk £ 0, 

No Capítulo 12 se constatará que há outras razões que motivam o uso 
de sinais cuja FAC tenha a propriedade descrita acima. De fato, será visto 
que existe uma justificativa baseada em argumentos não apenas numéricos, 
mas também em argumentos dinâmicos, para o uso de tais sinais. 

Como o leitor já terá percebido, o uso de sinais aleatórios na identifica- 
ção de sistemas tem algumas dificuldades de ordem prática. Em primeiro 
lugar, uma vez que o registro do sinal de entrada tem duração finita, é de se 
esperar que a FAC de tal sinal não satisfaça a condição ruu(k) = 0, Vk £ O 
de forma exata, porque o limite N — oo presente na Eq.4.5 não é sa- 
tisfeito. Parece razoável, entretanto, supor que essa condição seja 
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aproximadamente satisfeita sempre que N for suficientemente grande, ou 
seja, ruu(k) = 0, Vk 4 0. Mas como será possível diferenciar o caso em que 
a FAC não é nula em k £ O devido ao número finito de dados, da situação 
em que a FAC não é nula porque o sinal não é totalmente aleatório? Em 
outras palavras, quão boa deve ser a aproximação ruu(k) = 0, Vk £ O para 
que o sinal u(k) seja considerado aleatório para fins práticos? 

A fim de responder a pergunta acima, é necessário introduzir o conceito 
de intervalos de confiança. Seja uma variável aleatória z cuja distribui- 
ção é gaussiana com média Z e desvio padrão o;. Seja uma determinada 
realização x; de x, então a probabilidade de z; estar compreendida nas 
faixas: 


T-o;< ty <Z+os, 
Z-1960,< x <Z+1,9607, 
Z-30;< z; <T+do (4.16) 


é de 68%, 95% e 99,7%, respectivamente. Seja fzz(k) a FAC de « estimada 
a partir de uma amostra de tamanho N. O desvio padrão de f;z(k) é dado 
por o; = 0:/VN. Assume-se que a distribuição de fzz(k) é gaussiana.? 
Usando-se os resultados em (4.16), pode-se dizer que há uma probabilidade 
de 95% de que os valores da FAC de um sinal do tipo ruído branco u(k) 
com média zero satisfarão as relações abaixo, que são equivalentes, 


Puulh) = 1,9607 < Paulk) < Paul) + 1960; (417) 
= « Paulh) q dia, VELO, (4.18) 


em que foi utilizado o; = cu/V'N, e o fato de que para um sinal aleatório 
fuu(k) — O. A barra abaixo de fuu(k) indica que a média é tomada não 
entre os valores desse coeficiente para diferentes valores de k, mas entre 
diversas estimativas de ruu(k), para o mesmo valor de k, conforme definido 
na Eq.4.1, Portanto, um sinal u(k), k = 1,2,... ,N, cuja função de auto- 
correlação satisfaça (4.18), pode ser considerado aleatório com confiança de 
95%. 

Deve ser notado que é comum trabalhar com FACs normalizadas. Para 
fins desta discussão, chame-se a FAC normalizada de ?::(k) e a normalização 
é tal que ?,:(0) = 1. Para ver como conseguir isso, considere um sinal u(k) 


3A distribuição de f.y(k), para cada valor de k e para dois processos não correlacio- 
nados Z e y, é assintoticamente gaussiana devido ao teorema do limite central. 
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com média zero e desvio padrão ou. A variável normalizada z(k) = u(k)/ou 
terá média zero e desvio padrão unitário, ou seja, o; = 1. Da Eq.4.5 
percebe-se que a FAC normalizada é r:(k) = Tuu(k)/o2, portanto, está 
mostrado que normalizar o sinal z(k) = u(k)/ou resulta em f,:(0) = 1. 
Finalmente, reescrevendo-se (4.18) para o caso normalizado, tem-se 


-1,96 1196 
VN VN 


O mesmo se aplica para a função de correlação cruzada fuy(k), que é 
normalizada dividindo-se u(k) por ou e y(k) por oy. Consegiientemente, a 
FCC normalizada aparece dividida por o,oy. No caso de lidar com funções 
normalizadas, tanto a variância quanto o desvio padrão é unitário, portanto, 
os limites de confiança são e/VN , em que c assume os valores 1,645; 
1,960 ou 2,576 nos casos em que o nível de confiança é 90%, 95% ou 99%, 
respectivamente. Tais limites de confiança, para assumirem os valores na 
escala da função de autocorrelação, precisam ser multiplicados por ou — 
compare com a Eq. 4.18. 

No caso da função de correlação cruzada, os limites de confiança devem 
ser multiplicados por /CuOy à fim de serem expressos na escala não norma- 
lizada. Há resultados semelhantes, mas que consideram que os limites de 
confiança se alargam (levemente) à medida que k aumenta. Tais diferenças 
não são significativas na prática, sendo que o teste na Eq. 4.18 é feito ape- 
nas para verificar se fuu(k) tem valores estatisticamente significativos para 
valores do atraso k relativamente pequenos (tipicamente 1 < k < 10). 


< frlk) Vk O. (4.19) 


Exemplo 4.3.1. Interpretação de limites de confiança 


A faixa de confiança representa a hipótese nula, Ho, de que a correlação 
não é significativa, naquele nível de confiança. Assim, suponhamos que 
para um determinado atraso ko a FAC de um sinal com N = 500 seja 
Tuu(ko) = 0,077. Deseja-se saber se tal correlação em kg é significativa. 

Note que, para esse caso, as faixas de confiança de 68% e 95% são, 
respectivamente 


1,645 1,960 
su6S 0074 + 1500 10,088, 
600 “2 O SE 


Como ruu(ko) está fora da faixa de confiança de 68%, pode-se rejeitar 
Ho com confiança de 68%, Mas será que 0,077 não está próximo demais de 
0,074 para ser considerado diferente? É precisamente essa incerteza que o 
nível de 68% (e não muito mais do que isso) procura refletir. Note que como 
Tuu(ko) não está fora da faixa de confiança de 95%, não se pode rejeitar 
Ho com confiança de 95%. o 
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Uma determinada realização de um processo genuinamente ruído bran- 
co pode falhar no teste da Eq.4.18. Portanto, ao usar sinais não- 
autocorrelacionados em identificação, é conveniente, sempre que a ausência 
de correlação for um requisito do método sendo usado, testar (a priori ou 
a posterioni) se os sinais de entrada são, de fato, do tipo ruído branco. Se 
algum sinal não satisfizer a Eq. 4.18 e se a ausência de correlação for uma 
necessidade, outro sinal de entrada ou uma outra realização do mesmo sinal 
deve ser gerado. 

Há sinais que podem ser gerados de maneira simples e que, à semelhança 
de sinais aleatórios, também têm a propriedade ruu(k) = 0, Vk £ 0. Tais 
sinais são os chamados sinais pseudo-aleatórios. Antes de descrever tais si- 
nais, o próximo exemplo ilustrará a equivalência dos intervalos de confiança 
definidos nas expressões (4.17) e (4.18). 


Exemplo 4.3.2. Verificação de limites de confiança da FCC 


Considere a Figura 4.7. 
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FIGURA 4.7: Histograma de coeficientes da FCC 


Histograma de coeficientes de correlação ?zy(k) entre os sinais 
não correlacionados z(k) e y(k), para valores específicos de atra- 
so, Todos os gráficos sugerem gaussianidade. A média e o desvio 
padrão em cada caso são; (a) r=y(-6) = 0,0027, o; = 0,0709, 
(b) rzy(=1) = -0,0035, o; = 0,0696, (c) rzy(4) = —0,0023, 
os = 0,0676, (d) r=y(9) = 0,0006, o; = 0,0656. Os limites de 
confiança +1,96/200 x +0,14 aproximam-se de ray + 297, con- 
firmando a equivalência de (4.17) e (4.18). 
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As expressões (4.18) e (4.17) são equivalentes. No caso da FCC tais 
expressões também são válidas para k = 0. A Figura 4.7 mostra a distri- 
buição dos coeficientes de correlação estimados para quatro valores distintos 
do atraso, a fim de verificar a validade dos limites de confiança, definidos 
em (4.18) e (4.17), para a FCC. Para gerar a Figura 4.7 foram gerados 500 
pares de sinais aleatórios z(k) e y(k), com k = 1,...,N e N = 200. A 
função de correlação cruzada entre tais pares de sinais, ?zy(k), foi estimada 
500 vezes (uma para cada par de sinais) para atrasos entre —15 <k < 15. 
Conseqiientemente, para cada valor de atraso da FCC, foram estimados 
500 valores. Os limites de confiança +2//200 = 0,14, que aparecem 
em (4.18), aproximam-se bastante de rzy + 207, conforme visto em (4.17), 
confirmando a equivalência entre tais expressões. [n| 


4.3.1 Sinais binários pseudo-aleatórios 


Dentre os sinais pseudo-aleatórios, os sinais binários são bastante populares 
pois são fáceis de gerar. Tais sinais têm apenas dois valores possíveis (daí 
a denominação “binários”), +V e —V. Qualquer mudança de valor somente 
pode ocorrer em instantes bem definidos t = 0,74,27b,... Um aspecto 
interessante desses sinais é que as mudanças entre valores é determinada de 
forma determinística e, consegientemente, exatamente o mesmo sinal pode 
ser gerado repetidas vezes. Outra característica de sinais pseudo-aleatórios 
é que são periódicos com período T = NT, sendo N um número ímpar. 
Ao longo de um período há (N + 1)/2 intervalos, num nível binário, e 
(N — 1)/2 intervalos, no outro nível. A função de autocorrelação típica de 
sinais pseudo-aleatórios é mostrada na Figura 4.8. 

A Figura 4,8 mostra que para um número de atrasos menor que a perio- 
dicidade do sinal a respectiva FAC aproxima-se da FAC de um sinal aleató- 
rio. Por outro lado, a rigor, a FAC de um sinal pseudo-aleatório é periódica. 
Tais considerações justificam a denominação “pseudo-aleatório” para sinais 
determinísticos com FAC típica conforme a mostrada na Figura 4.8. De- 
ve ger notado que, a fim de que os sinais usados tenham as características 
ora descritas, é necessário usar um número inteiro de períodos dos sinais 
pseudo-aleatórios. 

O tipo mais comum de sinal binário pseudo-aleatório (PRBS do inglês 
pseudo random binary signal) é a segiiência de comprimento máximo ou 
simplesmente sinais de segiência m. A fim de gerar sinais de seqiiência m, 
é necessário executar a operação OU-Exclusivo entre alguns bits do registro 
de deslocamento (ver Figura 4.9). É importante notar que são poucas as 
combinações que resultam em sinais de sequência m. A Tabela 4.1 resume 
os resultados. 
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ice di O e ” aproxima-se à FAC de 
Tuu(T) I ginal aleatório ES 


FIGURA 4.8: FAC típica de sinais pseudo-aleatórios 


FAC típica de sinais pseudo-aleatórios. A parte indicada no qua- 
dro tracejado aproxima-se à FAC de sinais aleatórios. 


temporização 


FIGURA 4.9: Circuito para gerar sinais PRBS 


Circuito para gerar sinais PRBS de segiência m. A cada pulso 
de temporização o circuito define um valor (+V ou -V) na saída. 
A porta OU-Exclusivo executa a soma em módulo de 2, ou seja, 
191=000=0e100=001=1. 


Sinais PRBS de segiiência m têm períodos iguais a T = NTp para 
N=2" —1, sendo n o número de bits do registro de deslocamento. Assim, | 
na Figura 4.9 n = 6 e, portanto, N = 63. Três períodos do sinal gerado ] 
pelo circuito dessa figura são mostrados na Figura 4.10. 


Sinais PRBS de segiência m são bastante usados na prática 
de identificação de sistemas, principalmente de processos industriais. 
Entretanto, a fim de gerar sinais que possam ser usados com sucesso, é 
importante escolher adequadamente as variáveis envolvidas, V, n e Tb. 
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TabeLA 4.1: Conexões para gerar sinais de seqliência m 


bits usados pela 
porta OU-Exclusivo 

le2 

2e3 

3e4 

3e5 

5e6 

4e7 
234e8 

5e9 

7elo 

9ell 


sos cr 


mt 
= o 


os 


(1 o “o co so 100 120 140 160 180 
amostras 


Figura 4.10: Sinal PRDS de segliência m 


Sinal PRDS de segiiência m com n = 6. Observe que são mostra- 
dos os níveis lógicos, À transformação desses níveis para níveis de 
tensão 61 + +V e 0» —V (ver Exercício 4,13, prbs O). 


A escolha de V 6 normalmente limitada pela máxima excursão permitida 
ao sinal de excitação do processo, sem comprometer seu funcionamento 
adequado nem, tampouco, levar o sistema a operar em outra faixa linear. 
É fundamental perceber que o sinal PRBS gerado será normalmente de 
baixa amplitude e será somado ao sinal de entrada do processo a partir do 
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início da coleta de dados para identificação. Esse assunto será discutido 
com mais detalhes no Capítulo 12, mas considere a Figura 1.13a, onde pode 
ser observado o sinal de entrada de um conversor estático do tipo Buck. 
Nesse exemplo, o sinal de entrada em operação normal, ou seja, sem a 
excitação PRBS, é uma tensão constante de 2,35 V. A amplitude do sinal 
PRBS gerado foi V = +0,15V. Somando-se um sinal ao outro, obteve-se 
o sinal que foi efetivamente usado na identificação do referido conversor e 
cuja medição é mostrada na Figura 1.13a. 

O número de bits n determina a periodicidade do sinal gerado. Con- 
forme discutido acima, tal periodicidade depende tanto de n quanto de Th. 
A periodicidade do sinal PRBS não deve ser menor do que o tempo de 
acomodação do sistema que está sendo testado. Caso contrário, o sistema 
“perceberá” a periodicidade do sinal PRBS reduzindo, assim, o caráter de 
aleatoriedade do teste. Por outro lado, se o período for suficientemente 
longo, o sistema “verá” o sinal de excitação como sendo aleatório. 

O intervalo entre bits, Tb, deve ser compatível com a menor constante 
de tempo de interesse. Se Th for muito grande, o sistema interpretará o sinal 
PRBS como um degrau, sinal de características pobres para a maioria dos 
métodos de identificação. Por outro lado, se Th for muito curto, o sistema 
não terá tempo de responder a uma transição antes de chegar a próxima. 
Um resultado heurístico que normalmente fornece bons resultados sugere 
que Th seja escolhido conforme 

Tmin Tmin 
0 < T< 2" 
sendo que Tmin é a menor constante de tempo de interesse. Na maioria das 
situações práticas, o tempo de amostragem é constante. Assim, a maneira 
de aumentar o intervalo entre bits é manter constante cada valor original do 
sinal PRBS por um certo número de intervalos de amostragem. Suponha que 
o sinal original seja y = [010001011...]. Se for desejado que o intervalo en- 
tre bits seja o dobro, então o novo sinal será 7) = [001100000011001111...]. 
Certamente que essa mudança tem consegiiências sobre as características 
do sinal, conforme explorado no Exercício 4.14. Deve ser notado que o que 
foi aqui discutido com respeito ao intervalo entre bits em sinais PRBS é 
igualmente válido para o intervalo entre valores de um sinal aleatório. 

Na identificação de sistemas lineares é comum escolher Th mais perto do 
limite inferior, ao passo que para sistemas não-lineares bons resultados têm 
sido obtidos tomando-se Th mais perto do limite superior. Por exemplo, a 
heurística (4.20) sugere que entre 3 e 10 valores de uma segiiência PRBS | 
sejam aplicados durante um intervalo de tempo equivalente à menor cons- 
tante de tempo relevante no sistema. Normalmente, Tmin não é conhecido 
a priori, mas tal informação pode ser facilmente obtida da resposta ao de- 
grau. Um ponto importante a observar na prática é que os patamares do 


(4.20) 
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sinal PRBS devem ser suficientemente longos para dar tempo ao sistema de 
prover alguma resposta, mas deve ser suficientemente curto para que o sis- 
tema não atinja o regime permanente (ver Exercício 4.18). Essa heurística 
é aproximadamente descrita em (4.20) e poderá ser observada na figura do 
próximo exemplo. 


Exemplo 4.3.3. Sinal tipo PRBS em turbina de avião 


Uma das vantagens dos sinais tipo PRBS é que são relativamente simples 
de produzir na prática. A Figura 4.1la mostra um sinal binário pseudo- 
aleatório obtido chaveando-se o nível de vazão de combustível entre dois 
valores. 


o 20 “0 so so 100 120 140 160 180 200 
(6) 
78 
75, 
a 7a) 
72 


º 20 40 co so 120 140 160 180 200 


100 
tempo (s) 
FIGURA 4,11: Sinal PRBS de segiiência m e respectiva resposta em avião 

Sinais medidos em turbina de avião, (a) sinal PRBS de seqiiência 
m de vazão de combustível (cm?/s) e (b) velocidade de rotação 


de eixo medida (%) (CuirAs et al, 2001, copyright IEEE 2001; 
CuiRAs, 2002), 


Trata-se de uma turbina de avião da Rolls Royce modelo Spey Mk202 
(Curas et al., 2001; CHIRAS, 2002), A Figura 4.11b mostra o correspon- 
dente sinal de velocidade de rotação do eixo, Note que a excursão do sinal 
de saída é de aproximadamente (778 — 72) x 100/75 = 8% da saída, ou 6% do 
fundo de escala. Note também que nem mesmo para os “patamares” mais 
Jargos, o sinal de saída chega a atingir o estado estacionário, Essa caracte- 
rística é comum em sinais PRBS bem dimensionados. Os sinais mostrados 
nessa figura qualificam-se como sinais de entrada e saída, respectivamente, 
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em problemas de identificação da referida turbina (OrIRAS ct al., 2001). Os 
espectros dos sinais na Figura 4.11 são considerados no Exercício 4.12. O 


4.4 Reduzindo o Efeito do Ruído no Domínio da 
Freqiiência 


As mesmas vantagens provenientes de se tirar a média de sinais temporais 
podem ser obtidas tirando-se a média de dados no domínio da fregiiência. 

Sejam yi(t), à = 1,2,..., Nf as respostas de um determinado sistema 
aos sinais senoidais u;(t) = A;sen(wit) à = 1,2,..., Nf. Note que o valor 
de Ng não precisa ser muito elevado para, na maioria dos casos, se ter uma 
boa noção da resposta em frequência do sistema em questão. 

Suponha que seja possível medir tanto o ganho, Gs, quanto a fase, qi, 
do sistema nas Ny fregiências de teste w; apenas comparando, após os 
transitórios terem esvanecido, os sinais de entrada e saída, u;(t) e y:(t). 
Isso pode ser feito lembrando-se de que yi(t) = G; A; sen(wit + di) + e(t), 
i=1,2,...,Nr. Tal procedimento, entretanto, é mais sensível à presença 
do ruído e(t) do que o seguinte método. 

De posse do sinal de saída yi(t), resposta à excitação senoidal 
ui(t) = Assen(wit), à = 1,2,... , Nr, as seguintes constantes podem ser cal- 
culadas: 


8 wi; (2N7)/w; á 
é = 9 A y(t)sen(wit)dt, 


c wi (2Nm)/wy 
= axe, v(t) cos(wit)dt, (4.21) 


sendo N o número de ciclos da saída. Finalmente, pode-se mostrar que 


Gm AS +CNjA; 
dm tanTH(Cy/S;). 


É interessante notar que os escalares S; e C; podem ser interpretados 
como Índices de correlação entre o sinal y(t) e sinais senoidais e cossenoidais 
de fregiência w;, respectivamente (ver Exercício 4.16). Outra observação ] 
importante é notar que $; e O são os coeficientes de Fourier, das harmônicas | 
com fregiiência w;. | 
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4.4.1 Funções de densidade espectral de potência 


Comparando-se as Seções 3.5 e 4.2 percebe-se que são análogas. Em ambas 
foram usadas relações muito parecidas. Na Seção 3.5 foi usado o somatório 
de convolução para obter-se a resposta ao impulso, ao passo que na Seção 4.2 
usou-se a equação de Wiener-Hopf. A grande diferença é que o somatório 
relaciona a resposta ao impulso com os sinais do sistema, u(k) e y(k), ao 
passo que a equação de Wiener-Hopf relaciona a resposta ao impulso com a 
FAC do sinal de entrada u(k) e com a FCC entre u(k) e y(k). A consegiiente 
robustez ao ruído é o resultado das propriedades das funções FAC e FCC, 
que são relativamente robustas ao ruído. 

Um procedimento semelhante pode ser obtido com os resultados da 
Seção 3.6 e da presente seção. Conforme pode ser constatado observando-se 
a Eq.3.41, é possível obter uma estimativa da resposta em freqiiência do 
sistema simplesmente dividindo-se a transformada de Fourier (TF) da saída 
pela TF do sinal de entrada. Uma justificativa para esse procedimento pode 
ser obtida simplesmente aplicando-se a transformada de Fourier ao somató- 
rio de convolução. No domínio da freqiiência a convolução entre u(k) e A(k) 
torna-se o produto entre U(jw) e H(jw). Semelhantemente, aplicando-se a 
transformada discreta de Fourier à equação de Wiener-Hopf, resulta em 


Flrulk) = 2 (Emtrat-0) 
i=0 
Duplo!) = H(P“)d(w). (4.22) 


A entidade complexa Duy(jw) é a função de densidade de potência do 
espectro cruzado entre u(k) e y(k), ou seja, 


o 


Ddu(ev)= 3) ruy(kjerivt, (4.23) 


=-00 


e a grandeza real Du(w) é à função de densidade espectral, ou o espectro, 
de u(k): 


Du(w) = a ruulk)e iv, (4.24) 


k=-o0 


Deve ser notado que alguns autores referem-se a Duy € du respectiva- 
mente como o espectro de potência cruzada entre u(k) e y(k), e o espectro de 
potência de u(k). Tais autores reservam o termo densidade espectral para o 
espectro de potência normalizado por o,oy ou o2 (JENKINS; WATTS, 1969). 
Portanto, (4.22) pode ser usada para estimar À (eiu) bastando para isso usar 
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estimativas de duy(ei) e de Du(w). Um dos estimadores não-paramétricos 
mais comumente utilizados para obter uma estimativa de Pu (tw) de um sinal 
real u(k), k = 0,1,... ,N é o periodograma 


o gd a 
du(w) = Et DD uliu(hjeriett=i, (4.25) 
i=0 k=0 


Analogamente para a função de densidade de potência do espectro cruzado, 
tem-se 


NN 
(ot) = qo online, (420 


Deve ser notado que (4.25) e (4.26) basicamente são implementações 
numéricas da transformada discreta de Fourier da FAC de u(k) e das FCC 
de u(k) e y(k). O próximo exemplo ilustra o procedimento e os benefícios | 
resultantes. 


Exemplo 4.4.1. Estimação estocástica da resposta em fregiência 


Considere a função de transferência do Exemplo 3.5.1. Um sinal pseudo- | 
aleatório de segiiência m de 11 bits foi usado para excitar o sistema. Apenas 
512 amostras foram usadas, À resposta do sistema foi adicionado ruído 
branco com variância o2 = 1. Para permitir a comparação do desempenho 
de (3,41) e (4.22) na presença de ruído, as respostas em freqiiência estimadas 
usando-se cada uma são mostradas nas Figuras 4,12 e 4.13, respectivamente. 
Comparando-se as Figuras 4,12 e 4.13 constanta-se que, conforme es- 
perado, a Eq.4.22 é mais robusta ao ruído nos dados. O procedimento | 
ilustrado no presente exemplo é normalmente usado na prática em casos 
em que apenas uma estimativa grosseira da dinâmica do sistema é necessá- 
ria. Em casos em que modelos paramétricos mais detalhados são requeridos, 
os métodos estudados a partir do Capítulo 5 são mais adequados. [a] 


4.5 Persistência de Excitação 


Na Seção 3.5 foi visto que a viabilidade de estimar a resposta ao impulso 
a partir da Eq. 3.38 depende da matriz U ser não singular. Naquela seção 
foi observado que uma forma de garantir a não singularidade de U é usar 
um sinal de entrada u(k) suficientemente ativo. Considere o caso trivial em 
que a entrada é constante, u(k) = c, Vk. Nesse caso, todas as colunas de 
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10" 10º 
freqoência (rad/s) 


FIGURA 4.12: Respostas em frequência “real” e estimada 
(a) ganho, e (b) fase das respostas em frequência do sistema origi- 


nal (traço contínuo) e estimada a partir de y(k) e u(k) (tracejado) 
usando (3.41) (ex421 0). 


U são idênticas e, portanto, U-! não é definida. Na prática, são usados 
sinais de entrada mais ativos do que uma constante. O conceito de per- 
sistência de excitação — ou excitação persistente — permite quantificar o 
quão ativo é um sinal em regime permanente e, assim, quão adequado é 
para identificação de sistemas. 

Antes de propriamente definir persistência de excitação (PE), deve ser 
notado que, por motivos discutidos na Seção 4.2, a Eq. 4.12 é mais adequada 
para identificação de sistemas do que a Eq. 3.38. Sendo assim, uma definição 
de persistência de excitação pode ser enunciada no contexto da Eq. 4.12, 
como se segue. 


Definição 4.5.1. Um sinal u(k) é persistentemente excitante de ordem n 
se os limites 


N 
É a DE 
= im N > u(k), (4.27) 
. i, N 
ruulk) = Jim q > (u(i) — 0) (u(i+k) — 1) (4.28) 
existirem e se a matriz 
Riu = [ruuli— 9)ri= 1, Mj=1l.om (4.29) 
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ta) 
oem er — 


frequência (rad/s) 


FIGURA 4.13: Respostas em frequência “real” e estimada 


(a) ganho, e (b) fase das respostas em fregiiência do sistema ori- 
ginal (traço contínuo) e estimada a partir de Ruy(jw) e Ruu(jw) 
(tracejado) usando (4.22) (ex421 0). 


for não singular. Sendo que u(k) foi considerado ergódico e, portanto, a 
esperança matemática foi substituída pela média. O sinal será persistente- 
mente excitante se sua média e FAC existirem e se a matriz de covariância 
de u(k), Rh, € IR"X" for não singular. 


A existência dos limites em (4.27) e (4.28) será uma consegiiência do 
sinal ser estacionário. Enquanto se estiver no regime “transiente” do sinal, 
tais limites não convergirão. Por exemplo, considere o degrau unitário. Em 
regime permanente o valor desse sinal é constante e igual a um, ou seja, em 
regime permanente ii = 1 para o degrau unitário. 

No Complemento 4.1 será dada outra definição para o conceito de persis- 
tência de excitação baseada no domínio da fregiiência. Intuitivamente, um 
sinal persistentemente excitante de ordem n é um sinal que tem potência 
espectral em n ou mais frequências distintas. Uma condição para estimar n 
parâmetros é que o sinal de excitação deve ser persistentemente excitante 
pelo menos de ordem n. 


Exemplo 4.5.1, Persistência de excitação de sinais 


Seja u(k) um pulso, u(k) = 1, k = 0 e u(k) = 0, Vk f O. Isso resulta em 
Rã, = 0 no limite de N > oo, Ou seja, um pulso não é persistentemente 
excitante de nenhuma ordem, | 
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Se u(k) for um degrau de amplitude a, então ruu(k) = a? e Rh, só não 
será singular para n = 1. Ou seja, o degrau é um sinal persistentemente 
excitante de ordem 1. Assim sendo, em regime permanente, a resposta ao 
degrau de um sistema só serve para estimar um parâmetro, o ganho estático. 

Se v(k) for ruído branco com variância o?, então ryv(k) = o26(k), sen- 
do ô(k) a função delta de Dirac. Portanto, a matriz R?, = o?In é não 
singular para qualquer valor de n. Conseqiientemente, o ruído branco é 
persistentemente excitante de todas as ordens. 

Se v(k) for ruído branco, e o sinal u(k) for obtido filtrando-se v(k) com 
um filtro de média móvel F(q), então o sinal 


uk) =v(k) + fu(k = 1) +... + fpv(k — p) (4.30) 


também será persistentemente excitante de qualquer ordem. Para ver isso, 
basta notar que o espectro &,(w) é plano e que o filtro F(q) só pode ter 
p valores nulos no seu espectro. Consegiientemente, o espectro de u(k), 
du(to) = | F(ei”) |? d,(w) ainda tem infinitos valores não nulos. D 


No exemplo acima verificou-se que o degrau unitário é um sinal per- 
sistentemente de ordem 1. Assim, excitando-se um sistema com tal sinal 
permitiria estimar apenas um parâmetro. Como é possível, então, que o 
degrau seja tão usado para estimar os parâmetros de sistemas com mais de 
um parâmetro? A aparente contradição levantada por essa pergunta se ori- 
gina no fato que quando o degrau é utilizado em identificação de sistemas, 
utiliza-se o período transitório gerado pelo mesmo. Durante esse período 
(N é relativamente pequeno), os limites (4.27) e (4.28) não convergem. Em 
estado estacionário, o conhecimento do degrau e da resposta do sistema a 
esse sinal somente permite estimar um parâmetro (o ganho CC), conforme 
previsto pela Definição 4.5.1, 


4.6 Complementos 


Complemento 4,1, Definição de PE no domínio da fregiiência 


Definição 4,6,1, Um sinal u(k) com espectro Du(w) é persistentemente 
excitante de ordem n se, para todos os filtros do tipo 


Ma(g) = mig”! +... mag”, (4.31) 


a relação 
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[Mn(eiº) PP Du(w) = 0 (4.92) 


implica | Ma (e!) [2= 0. 

Para melhor apreciar a definição acima, as seguintes relações devem ser 
levadas em conta. Seja u(A) conforme apresentado acima, e seja H(q) uma 
função de transferência (ou filtro) estável tal que 


v(k) = Hla)u(h), (4.33) 
di Mola) = | HP Gula) 
Dyu(e) = H(e)Du(tw). 
Uma prova detalhada dessas relações podem ser encontradas em (LJUNG, 
igjia m=[m ma...mn]” e a matriz de covariância de ordem n 


Puu(0) Fuu(=1) “e Tuu(l es n) 
Tuu(1) Tuu(0) quê Fuu(2 — n) 


rali) ata do All) 


Deve ser notado que como a FAC é simétrica, então ruu(k) = Tuu(—k). 
Além disso, a matriz R$, será não singular se, e somente se, 


m'Rym=0>m=o0, (4.34) 


que é a condição necessária e suficiente (assumindo a existência dos limites 
(4.27) e (4.28)) para que u(k) seja persistentemente excitante de ordem n. 
Pode ser verificado que 
mº Rum = E [Mn(a)u(A)P. 
Notando que 1/9 
Blj=> / dylujda, 
T d-oo 


tem-se 1 00 
m Rum = so [7 | Me) ulujda 
27 J.o 
Logo, a condição (4.34) pode ser reescrita como se segue: 
[M(e) 2 du(w) =0> M(e2) =0, 


que é a condição no domínio da frequência para que u(k) seja persistente 
mente excitante, 
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Complemento 4.2. O método de Levi 4 


O método a ser descrito neste complemento foi originalmente proposto 
por Levi (1959). O objetivo é determinar os coeficientes de um modelo 


o bo+bis+...+bps? 


miss I+as+...+ans”” 


(4.35) 


de forma que a sua resposta em fregiiência se aproxime de uma resposta 
em freqiiência, estimada a partir de procedimentos experimentais, Á(juw), 
tais como os descritos nas Seções 3.6 e 4.4. Em outras palavras, deseja-se 
estimar b;,i =0,1,... pea;,j =1,... mdeformaaseter H(jw) = H(jw), 
w <w<w. Claramente, o erro do modelo no domínio da fregiiência é 


N(ju) 


eljw) = Á(jw) — H(jw) = Aju) — DQjo): 


(4.36) 


A determinação dos coeficientes de H(s) de forma a minimizar e(jw)? 
resulta em um conjunto de equações simultâneas, não-lineares e de solução 
trabalhosa. Uma solução alternativa é conseguida multiplicando-se (4.36) 
por D(jw), resultando em: 


Dljweliw) = D(jw)R(juw) - N(jw) = a(w) + jf(vw) 
| Dljweljw) | = | a(w) + jB(w) |= va(w)? + B(w)? 


| Dljwe(ju) P = au)? + B(u)?. (4.37) 


Tomando-se a resposta em freqiência conhecida À (jw) em Nr freqiên- 
cias distintas, pode-se definir a seguinte função custo: 


Nr 
Ju =5 [o(ui)? + B(w)?]. (4.38) 


i=l 


Os coeficientes de H(s) podem ser facilmente determinados, usando-se téc- 
nícas convencionais, minimizando-se JL. Um dos méritos do trabalho de 
Levi foi montar uma matriz a partir da qual diversos problemas podem 
ser facilmente resolvidos. Portanto, a aplicação prática do método implica 
montar uma equação matricial da forma 


*DOEBELIN, 1980. 
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bo So 
br T 
[7 E 
da | | 7 
a |=|0. 4 
az U, 
as | 10 
q | [Us] 
as 0 


sendo que as divisões são determinadas pelo número de parâmetros b; e a; 
a serem determinados. As subdivisões indicadas acima exemplificam o caso 
em que os parâmetros a determinar são bo, b1, 01,42 e ag. Especificamente, 
para esse caso a equação matricial fica da seguinte forma: 


Lo 0 NT S& -Tl][b So 
0 Ly -S T 4 b n 
Tn —S UV, 0 —Us q|= 0 
NM) T; 0 Us 0 a U, 
T3 = Sa Us 0 - Us az 0 


Os elementos da matriz e do vetor acima são determinados pelas seguin- 
tes relações: 


Ne . 
Lj = Du; 


i=l 


T; = Studi [fu] - 


i=l 


5 = SeuiRo E) ; 


i=l 
No 
U; = Duil Aju). 
i=l 
Um estudo detalhado desse método pode ser encontrado em (NUNES, 
2006). Nesse trabalho, o método de Levi propriamente dito, bem com al- 


gumas variantes, foram investigados e comparados. Dentre as conclusões 
desse trabalho cita-se a vantagem em se normalizar o vetor de freqiiências. 
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Exemplo 4,6,1, O método de Levi 


O objetivo aqui é obter um modelo paramétrico, H(s), a partir da res- 
posta em fregitência, À'(jw), estimada usando os dados coletados em teste 
realizado numa planta piloto, conforme discutido no Exemplo 3.6.2. 

Como será constatado, a aplicação do método de Levi é direta uma vez 
que o modelador tenha escolhido o número de parâmetros a determinar. 
Para fazer isso, deve ser observado que | H(jw) |, em “altas” frequências, 
decai a uma taxa de -20 dB/dec e, coerentemente, a fase de H(jw) parece 
aproximar-se de -90º, Com base no exposto na Seção 2.4, fica evidente que 
a diferença entre pólos e zeros de H(s) deve ser igual a 1. 

À primeira tentativa seria um modelo de primeira ordem sem zeros. Isso 
requer a estimação de apenas dois parâmetros, bo e ay. Antes de mostrar 
o modelo assim estimado, deve ser notado que o formato de | H(jw) | (ver 
Figura 3.19a) sugere que o sistema é de ordem mais elevada que 1. Interes- 
sante observar que o modelo de primeira ordem derivado na Seção 1.4 não 
considerava a dinâmica do conjunto inversor, motor, bomba e tubulação de 
recalque. Portanto, o fato de a resposta em fregiiência mostrada na Figu- 
ra 3.19 revelar que o sistema é de ordem mais elevada que o modelo (1.38) 
não é nenhuma surpresa. 

A segunda tentativa seria aumentar a ordem do modelo. Entretanto, 
como a taxa de decaimento em altas frequências é -20 dB/dec, é importante 
manter a diferença de pólos e zeros sempre igual a 1. Assim, optou-se por 
um modelo de segunda ordem com um zero. Os modelos determinados são: 


0,24144 
H(s) 175,81s +1' 
1 
Mila 30,91655 + 0,19532 


2,8525 x 10152 + 243,24s + 1 


e suas respectivas respostas em fregiiência são comparadas com É(jw) na 
Figura 4.14, 

Conforme visto, a resposta em freqiiência do modelo Ha(s) ajusta-se 
bastante bem aos “dados”, (jw). A pequena diferença no ganho em estado 
estacionário pode ser ajustada manualmente aumentando-se o parâmetro 
0,19532, [a] 


Leitura Recomendada 


Os conceitos relacionados às funções de autocorrelação e correlação cruza- 
da, ou mais exatamente auto-covariância e covariância cruzada, podem ser 
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10º 1 10º! 


w(radis) 


FIGURA 4.14: Respostas em frequência estimada e de modelos 


Éjw), e respostas em fregiiência dos modelos obtidos usando- 
se o método de Levi. (—) H(jw), (- -) Hi(jw) e (--) Ha(juw). 
(a) ganho, e (b) fase (pulso 0). 


encontrados em textos básicos de estatística ou de matemática para ciência 
e engenharia (KREYSZIG, 1999), em livros de séries temporais (HAMILTON, 
1994; MORETTIN; ToLOI, 2004), ou ainda em livros de processos estocás- 
ticos (PAPOULIS, 1984), Nesses textos também podem ser encontradas as 
definições dos intervalos de confiança, que são fundamentais na interpreta- 
ção de resultados obtidos com funções de correlação a partir de conjuntos 
limitados de dados. Uma ótima introdução ao uso de funções de correla- 
ção na análise de sinais foi apresentada por Kohn (2006), no contexto de 
Engenharia Biomédica. 


O uso de funções de correlação na identificação de modelos não- 
paramétricos é um assunto relativamente antigo, sendo que existem diversos 
artigos na literatura que tratam do assunto. Uma ótima introdução ao as- 
sunto foi apresentada por Val e Lopes (2007). O uso de considerações de 
linearidade e aplicações industriais são abordados nos trabalhos de cunho 
tutorial de Godfrey (1980, 1986). O caso não-linear foi abordado de forma 
bastante completa por Billings e Fakhouri (1982). 


A estimação da resposta ao impulso, A(k), e da resposta em frequência, 
H(jw), foi discutida por Wellstead (1981) à luz de diversos exemplos reais. 
Nessa referência, também são abordados alguns aspectos práticos de como 
obter modelos paramétricos a partir de representações não paramétricas tais 
como h(k) e H(jw). 
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Norton (1986) dedica um capítulo ao problema de identificação usando 
funções de correlação. O uso de sinais pseudo-aleatórios são abordados de 
forma superficial, sendo que quase não é mencionado o problema de identi- 
ficação da resposta em freqiiência. Tal assunto é descrito em detalhes por 
Ljung (1987), que também coloca bastante ênfase na estimação empírica de 
funções de transferência. Os livros por Sôderstrôm e Stoica (1989) e por 
van den Bosch e van der Klauw (1994) apresentam, sem detalhes, concei- 
tos variados sobre estimação espectral, estimação empírica de funções de 
transferência e identificação usando funções de correlação. 


Exercícios 


4.1. Mostre que o ganho a que torna au(t) o mais próximo possível de 
y(t+7), no sentido de minimizar El(o u(t) — y(t+7))?], é a = ruy(T)/ruu(0) 
(Norton, 1986). 


4.2. Discuta o seguinte resultado: ruu(0) >|ruu(T)|, VT £ O. 


4.3. Mostre a equivalência das Egs. 4.6 e 4.7 com as Definições 0.1.9 e C.1.7, 
respectivamente. 


4.4. Monte a equação matricial representada pela equação (4.10) e indique 
como proceder para obter h(k). Mostre que se u(7) = 0, Vr £ 0, a solução 
do problema é mais simples. 


4.5. Compare os resultados do Exercício 4.4 com o desenvolvimento na 


Seção 4.2.1. 
4.6. Mostre que 


VM) = MoJulk=5)=55 Mk = Jay). (439) 
j=0 j=0 


Sugestão: considere h(k) e u(k) dois polinômios e multiplique-os. Mostre 
que o produto pode ser expresso por (4,39). 


4.7, Deduza a equação (4,11), 


4.8. Seja o sinal 


u(k) = 0,9e(k — 1) + 0,8e(k — 2) + O,7e(k — 3) + e(h), 


sendo que e(k) é ruído branco, com distribuição gaussiana, com média zero 
e variância unitária (02 = 1). Determine ruu(k), k = 0,1,...,5. 
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4,9, Seja o sistema 


0,17012 + 0,1208 


HO) = 2078507 +0,9070' 


(4.40) 


Utilize (4.12) e os resultados do Exercício 4.8 para determinar A(k). 
Simule a resposta ao impulso de H(z) e compare com os resultados obtidos 
usando (4.12). Observação: apesar de conceitualmente simples, a solução 
deste exercício é tediosa. Sugere-se escolher k = 15, 


4.10, Mostre que a matriz de covariância de u(k), Ruu na equação (4.12), é 
a esperança matemática do produto externo (ver definição 4.1.5) do vetor 
formado por u(k) e valores passados [u(k — 1), u(k — 2), ...] consigo mesmo. 


4.11, As três condições listadas a seguir são normalmente feitas em iden- 
tificação de sistemas. Comente (justifique) cada uma delas e diga que con- 
sequências cada uma tem no contexto de uma situação real. 


a) A média do ruído deve ser nula. 
b) O ruído de medição não deve ser correlacionado com a entrada. 


c) Tuu(7) = 0, VT £ 0, onde ruu(r) é a função de autocorrelação da 
entrada do sistema. 


4.12. Os gráficos de potência espectral dos sinais mostrados na Figura 4.11 
estão representados na Figura 4.15. Baseado nas informações do Exem- 
plo 4.3.3 e de seu conhecimento de sinais pseudo-aleatórios, explique as 
principais características e diferenças entre os espectros da Figura 4.15. Se- 
rá que o sinal de entrada excitou a dinâmica da turbina? 


4.13. Gere e mostre em um gráfico um sinal PRBS como o da Figura 4.10. 
Verifique a sua função de autocorrelação. Dica: use as rotinas prbs e 
myccf O para fazer este exercício. 


4.14, Repita o Exercício 4.13, mas agora aumente gradativamente o inter- 
valo entre bits Th (ver Eg. 4.20). Observe e discuta o efeito que esse aumento 
tem sobre o sinal, sobre sua FAC e sobre o seu espectro. 


4,15, Use o método descrito na Seção 4,4 para obter o diagrama de Bode 
de (4,40). Ao simular a resposta desta função de transferência aos sinais 
senoidais, adicione à saída do sistema ruído branco gaussiano com desvio 
padrão de 10%. Neste exercício faça Nf = 10, 
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ud e 


o3 04 05 06 o 08 09 1 
frequência (Hz) 


FIGURA 4.15: Espectro de sinais de entrada e saída de turbina de avião 
Espectros dos sinais (a) de vazão de combustível, e (b) de veloci- 


dade angular de eixo (CHIRAS et al., 2001, copyright IEEE 2001; 
CHIRAS, 2002). 


4.16, Discuta como o uso de S$; e C; em (4.21) contribui para a redução do 
ruído. Sugere-se considerar y(k) = y'(k) + e(k), em que y'(k) é o sinal ideal 
(sem ruído) e e(k) é puramente aleatório de média nula. 


4.17. Considere os sinais de entrada e saída mostrados na Figura 4.16. 
Verifique a aleatoriedade do sinal de entrada bem como a correlação cruzada 
entre os sinais de entrada e saída. Dica: use a rotina myccf O. Utilize (4.12) 
para estimar a resposta ao impulso do sistema de bombeamento onde foram 
coletados os dados. Aplique o método de Levi, descrito no Complemento 4.2, 
para ajustar um modelo paramétrico à resposta em fregiiência do sistema 


4.18, Considere o sistema H(s) = 1/(1000s + 1). Simule a resposta desse 
sistema para uma entrada do tipo PRBS para os seguinte casos: Th = 1, 
Ty = 100, Th = 1000 e T = 10.000, Use o tempo de integração constante 
igual ao tempo de amostragem T; = 1. Faça gráficos mostrando tanto os 
sinais de entrada quanto as respectivas respostas do sistema. Que situação 


parece ser mais adequada para a identificação do sistema a partir desses 
dados? 
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FIGURA 4.16: Resposta de uma planta a um sinal pseudo-aleatório 


Dados do arquivo prbsa02 (Ô, (a) sinal binário pseudo-aleatório, 
entrada para a planta piloto de bombeamento de água descrita na 
Seção 1.4, (b) sinal de saída (vazão). 
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O Estimador de Mínimos 
Quadrados 


5.1 Introdução 


O método de mínimos quadrados é um dos mais conhecidos e mais utilizados 
nas mais diversas áreas de ciência e tecnologia. A origem da idéia básica 
pode ser encontrada nos trabalhos de Gauss sobre estudos astronômicos.! 
A fim de melhor apreciar alguns dos ingredientes principais que compõem 
o método dos mínimos quadrados, considere o seguinte trecho (SORENSON, 
1970): 


Se as observações astronômicas e outras grandezas nas quais 
se baseia o cálculo de órbitas fossem absolutamente corretas, 
o resultado, ainda que obtido a partir de apenas três ou qua- 
tro observações, também seria estritamente correto (na medida 
em que se supõe que o movimento ocorre exatamente de acordo 
com as leis de Kepler) e, portanto, o uso de outras medições 
seria útil apenas para confirmação, mas desnecessário para cor- 
reção ou ajuste. Mas uma vez que todas as nossas medições e 
observações nada mais são do que aproximações da realidade, 
o mesmo é verdade para os resultados que se baseiam nelas, e 
o alvo mais elevado de todos os cálculos feitos relacionados a 
fenômenos concretos deve ser o de se aproximar, tanto quanto 
possível, da verdade. Isso, entretanto, não pode ser alcançado 
a não ser pela adequada combinação de observações adicionais 
àquelas estritamente necessárias à determinação das grandezas 
desconhecidas. Esse problema só pode ser resolvido apropria- 
damente quando um conhecimento aproximado da órbita já foi 


!Gauss, 1963, 
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obtido, conhecimento esse que posteriormente deve ser ajustado 
de forma a satisfazer todas as observações da forma mais exata 
possível. 


No trecho acima, Gauss menciona diversos aspectos básicos concernentes 
à aplicação do método de mínimos quadrados. É instrutivo, ao começar o 
presente capítulo, indicar alguns desses pontos (SORENSON, 1970). 


1. Gauss se refere a um número de observações estritamente necessário 
à determinação das grandezas desconhecidas. Na maioria dos casos 
abordados no presente livro, esse número é igual ao número de pará- 
metros a determinar; 


2. Gauss deixa claro que, por causa dos erros de medição, mais observa- 
ções do que o número mínimo são necessárias. Em outras palavras, o 
uso dessas observações “redundantes” resultará na redução dos efeitos 
dos erros; 


3. o problema da modelagem está implícito na observação de que o mo- 
vimento observado satisfaz as leis de Kepler; 


4. os parâmetros estimados devem satisfazer as observações da forma 
mais exata possível. Em outras palavras, a diferença entre observação 
e cálculo (usando os parâmetros estimados) deve ser mínima. 


Neste capítulo será apresentado o algoritmo de mínimos quadrados, e 
os aspectos mencionados acima serão formalizados. Para efeito de apresen- 
tação, o método será primeiramente aplicado num contexto de regressão 
linear, onde os regressores serão indicados por Z1,... Tn: À aplicação na 
estimação de parâmetros de modelos dinâmicos será abordada logo a seguir, 
sendo que nesse contexto os regressores serão indicados por 1... ,Yn- 


5.2 Gerando Sistemas de Equações 


Nesta seção será seguida uma forma sistemática de montar e resolver siste- 
mas de equações, Isso será de grande utilidade para entender como estimar 
os parâmetros de um modelo dinâmico, Para maior clareza, no início, será 
discutido o problema com solução única, O caso sobredeterminado, para o 
qual há mais equações do que incógnitas, será tratado depois. 


5.2.1 Sistemas com solução única 


Uma forma de definir um conjunto de equações é considerar uma função 
escalar y = f(x) e várias aplicações dessa mesma função, ou seja, 
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w = fa) 
vw» = fas) 
un = faxn). (5.1) 


No caso vetorial, f(x) : IR” > IR depende de um vetor den parâmetros, 
8. Dizemos então que a função f(x) é parametrizada por 0 EIR” e pode ser 
representada da seguinte forma: 


y=f(x,0). (5.2) 


Como visto acima, a função (5.2) define um conjunto de equações, 
bastando para isso escrever (5.2) para várias observações do escalar y (va- 
riável dependente) e do vetor de variáveis independentes (ou regressoras) 
da seguinte forma: 


w = f(x1,9) 
mw = f(x2,9) 
un = f(xn0), (5.3) 


sendo que y; é a i-ésima observação de y, e x; = [Z1; Taj... Tni)” são as 
i-ésimas observações dos n elementos do vetor x. Em outras palavras, a 
função (5.2) define uma família de equações, sendo que N membros de tal 
família estão representados em (5.3). À partir de agora, cada membro será 
chamado de restrição, ou seja, (5.3) é um conjunto de N restrições escritas 
a partir da Eq. 5.2. 

Sendo conhecidos os conjuntos (yn,... sy) e (x1,... ;XN), é pertinente 
perguntar se é possível determinar f e 0. A fim de responder a esta inda- 
gação, serão feitas as três considerações a seguir. 


Consideração 5.1, A função f e o vetor O não variam de uma restrição 
para a outra, ou seja, todas as restrições são, de fato, da mesma equação. 


Consideração 5.2. A Eq.5.2 pode ser reescrita como 
v=x"0. (5.4) 


Consideração 5.3. Serão tomadas n restrições de (5.2) a fim de se ter n 
equações para determinar os n elementos de 0, ou seja, nesse caso N = n. 
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A Consideração 5.1 deixa claro por que em problemas de identificação 
de sistemas dinâmicos normalmente supõe-se que o sistema seja invariante 
no tempo e que os sinais medidos sejam estacionários. Usando a linguagem 
da presente seção, se o sistema a ser identificado for variante no tempo, f 
ou 8 (ou ambos) seriam diferentes entre restrições, dificultando bastante o 
uso de um único f e a estimação de um único 0. 

A Consideração 5.2 implica f ser lincar nos parâmetros, Se f não satis- 
fizer a tal condição, 9 poderá, em princípio, ser estimado por métodos de 
estimação não-linear, 

Tendo feito tais considerações, as n restrições de (5.2) podem ser escritas 
na seguinte forma: 


un [7] 
E? (7) 
: = [x1x2... Xn] ; 
Ym On 
y = X0, (5.5) 


sendo X € IR"X" e x; a i-ésima coluna de X (note que x; é um vetor coluna 
de n linhas, ou seja, x; € IR” que é diferente de z; € IR). Na Eq.5.5, y 
é a variável dependente, pois depende dos regressores, 71,... , Tn, Que são 
também chamados de variáveis independentes. O é o vetor de parâmetros a 
determinar. Desde que X seja não singular, é possível determinar o vetor 
de parâmetros invertendo tal matriz, ou seja, 


0=X"y. (5.6) 


Exemplo 5.2.1, Sistema de equações Wiener-Hopf com solução única 


Neste exemplo, partindo da equação de Wiener-Hopf, Eq.4.11, será 
montado e resolvido um sistema de equações com solução única. Para isso, 
será suposto que se deseja determinar os primeiros N valores de h(k). Por- 
tanto, o sistema de equações resultante pode ser escrito em forma matricial 
como: 


ralo) ralo) ralo) co tal NADI[ MO 7] 
ruy(l) Ea Tuu(l) Tuu(0) ce Tuul-N+2) h() 
ra(N-1) e E RR h(N-1) 

Tuy = Ruuh. (5.7) 
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Ou seja, a equação matricial (5.7) é obtida tomando-se N aplicações, ou 
realizações, da equação de Wiener-Hopf (4.11). Nesse caso, o conjunto de 
variáveis que não se altera entre aplicações é [h(0)...h(N — 1)J”, que passa 
a ser considerado o vetor de parâmetros a estimar. 

Por construção, a matriz Ryu é quadrada, e para o caso estacionário, 
Ruu é também simétrica (ver Propriedade C.2.10, Anexo C). Observando 
os elementos da matriz, percebe-se que se a função de autocorrelação da 
entrada não for “excessivamente suave” então Ryu não só terá inversa, mas 
também será bem condicionada para valores não muito elevados de N. Por- 
tanto, será possível calcular 


h= Rj Tuy- (5.8) 


A última observação acima tem a seguinte interpretação. O sinal de entrada 
deve ser persistentemente excitante para excitar a dinâmica do sistema a ser 
identificado. Esse assunto foi discutido na Seção 4.5 e no Complemento 4.1. 
Em particular, no último capítulo foi visto que se o sinal de entrada tiver 
uma função de autocorrelação do tipo ruu(k) = 0, Vk £ 0, a matriz se reduz 
a Ruy =Tuu(0)I. 0 


Os procedimentos análogos das Seções 3.5 e 4.2.1 correspondem a mon- 
tar sistemas de uma única solução. A diferença principal entre esses pro- 
cedimentos é a equação a partir da qual as restrições são tomadas. Na 
Seção 3.5, a equação básica era o somatório de convolução, ao passo que na 
Eq. 4.2.1 a equação de Wiener-Hopf foi usada. Em ambos os casos o vetor 
de parâmetros a ser determinado era o mesmo, a resposta ao impulso do 
sistema, h. 


5.2.2 Sistemas sobredeterminados 


Se N > n restrições de (5.2) forem tomadas, tem-se então um sistema de 
equações sobredeterminado, ou seja, na Eq.5.5 têm-se X E IRNX", y E 
IRN*1 e, como anteriormente, 0 E IR"X!, 

Como a matriz X não é quadrada, ela não pode ser invertida. Entre- 
tanto, pré-multiplicando a Eq. 5.5 por X” em ambos os lados, tem-se 


X'y=X"XO0, (5.9) 


que é chamada de equação normal. Lembrando que o produto de uma 
matriz pela sua transposta é uma matriz quadrada, tem-se 


0=[(XTx]!XTy, (5.10) 
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no caso de XTX não ser singular. A matriz [XT X]-!XT, na Eq.5.10, é 
conhecida como a matriz pseudo-inversa. 

A Eq.5.10 é sem dúvida uma solução para o problema de determinar 
um vetor a partir de um conjunto de equações com mais restrições do que 
incógnitas. O resultado acima foi obtido usando-se simples manipulações 
algébricas aplicadas a matrizes. Na próxima seção será resolvido o mesmo 
problema, mas de forma diferente. O objetivo é achar uma solução com 
significado intuitivo, e não apenas uma expressão matemática cujas propri- 
edades são desconhecidas, como é o caso da Eq. 5.10. 


5.3 O Método de Mínimos Quadrados 


Sabe-se que a Eq. 5.6 é a única solução que satisfaz simultaneamente as n 
restrições do sistema de equações. Por outro lado, (5.10) é apenas uma das 
infinitas soluções do sistema sobredeterminado. Nesta seção, busca-se uma 
solução para tal sistema, mas uma solução que tenha algum “significado 
intuitivo”. 

Para tanto, no início será assumido que se conhece o valor estimado do 
vetor de parâmetros, ô, e que é cometido um erro É ao se tentar explicar o 
valor observado y a partir do vetor de regressores x e de 0, ou seja, 


y=xT0+€. (5.11) 


Tomando N > n aplicações da Eq.5.11 e representando o resultado em 
forma matricial, tem-se 


y=Xô+€, (5.12) 


sendo que £ E IRN é o vetor de erros cometidos ao se tentar explicar y 
como X Ô, 2 A fim de encontrar uma solução que tenha algum significado, 
deve-se procurar responder à seguinte pergunta: Dada uma solução ô, além 
de satisfazer a Eq. 5.12, que outra propriedade é desejável? Intuitivamente, 


2Neste livro, faz-se distinção entre o ruído e que corrompe a variável a ser explicada 
y (ou erro de regressão) e o resíduo, É, que é o erro cometido pelo modelo ao explicar 
a variável y, Portanto, um sinal com “ruído” (que pode ser devido a erros de medição, 
não-Jinearidades, dinâmica não modelada etc.) será indicado da seguinte forma: 


v=x'0+e. 


Por outro lado, o mesmo sinal poderá ser também descrito em termos do modelo e 
dos parâmetros estimados Ô, conforme visto na Eq,5.11, em que o resíduo É é o erro 
cometido pelo modelo ao tentar explicar y com os regressores em x e os parâmetros 
estimados Ô. Alguns autores chamam e de erro de regressão, reservando o termo ruído 
exclusivamente para ruído de medição. 
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seria interessante que Ô fosse tal que reduzisse é, em algum sentido. Para 
tomar a resposta mais precisa, define-se o somatório do quadrado dos erros 


N 
Ju =), Ei) =erE =| EIS, (5.13) 
i=l 


que nada mais é do que um índice que quantifica a qualidade de ajuste de 
Xô ao vetor de dados y. Portanto, seria, pelo menos em princípio, vantajoso 
que o valor estimado Ô minimizasse Juq. Às vezes, a função custo aparece 
dividida por N, o que em nada altera o problema de minimização, nem o 
resultado obtido. Substituindo É (ver Eq. 5.12) em (5.13), tem-se 


Juq = (y-Xô(y-x0) 
= y'y-yrxô-0xty+0'xTxô. (5.14) 


A fim de minimizar a função de custo Juq com respeito a ô, é necessário 
resolver (0Jmq/00) = 0. Fazendo-se isso, tem-se (ver Exercício 5.4) 


Eu = (9TX)T=XTy 4A(XTX + XTXÔ 
= -X'y-XTy+2X"xô, (5.15) 


sendo que as relações (A.3)-(A.5), no Anexo A, foram utilizadas. Igualando- 
se a última equação a zero tem-se 


d=[x"x]IxTy, - (5.16) 


que é igual à Eg. 5.10! Por fim, para que ô seja mínimo, é necessário que 
2 
2 duo  oyry 0, (5.17) 
[9/:) 


A Eq.5.17 é, de fato, verdadeira, pois 2X” X é positiva definida por cons- 
trução, Portanto, a Eq.5.10 é o estimador que fornece o valor de O que 
minimiza o somatório do quadrado dos erros. Resumindo, 
ômq = argg min Juq 
[XTXIX”y, (5.18) 
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sendo que (argg min Jyq) indica o argumento, pertencente no domínio de 
O, que minimiza a função de custo Jyq. Portanto, a Eq.5.16 6 a solução 
obtida pelo método de mínimos quadrados (MQ), que é igual à solução 
obtida utilizando-se a matriz pseudo-inversa, conforme visto na Eq. 5.10. 

A Eq.5.10 é também conhecida como o estimador de mínimos quadra- 
dos clássico ou onlinário. Aqui, esse estimador será denominado estimador 
MQ. Existem versões mais sofisticadas desse estimador, tais como o estima- 
dor de mínimos quadrados ponderados (MQP), o estimador generalizado de 
minimos quadrados (GMQ) e o estimador estendido de mínimos quadrados 
(EMQ). O primeiro destes será descrito na próxima seção, ao passo que os 
dois últimos serão tratados no Capítulo 7. 


Exemplo 5.3.1. Estimação dos parâmetros de uma reta usando MQ 


No Exemplo 1.3.1 os parâmetros de uma reta foram exatamente deter- 
minados a partir de duas restrições obtidas dos valores medidos. Conforme 
visto naquele exemplo, a reta determinada é representativa de toda a massa 
de dados (medições). A fim de ajudar o leitor a apreciar o que está aconte- 
cendo, deve-se lembrar de que “dois pontos definem unicamente uma reta”. 
Mas na massa de dados considerada há 21 pontos, ou seja, cada subconjunto 
de 2 pontos define uma reta. De fato, o conjunto de medições pode ser usa- 
do para determinar 210 retas diferentes! No Exemplo 1.3.1 foram usadas a 
décima primeira e a décima segunda observações para determinar a reta. A 
razão pela qual essa reta é representativa de toda a massa de dados é que 
as 210 retas representadas pelos dados são todas muito parecidas. 


Ao fim da Seção 3.7 o mesmo exemplo foi considerado, mas após adicio- 
nar, q posteriori, ruído aos dados medidos. Conforme verificado, os resulta- 
dos com ruído são inconsistentes com a totalidade da massa de dados. Isso 
pode ser apreciado notando-se que a reta determinada, apesar de passar 
ezatamente pela décima primeira e pela décima segunda observações, não 
é representativa, A conclusão óbvia é que a presença de ruído nas medições 
fortemente descaracteriza algumas das 210 retas, Entretanto, observando- 
se os dados, ainda se percebe que existe uma tendência que poderia ser 
representada por uma reta média, 


No presente exemplo, será utilizado o método MQ para estimar os dois | 
parâmetros de uma reta que, em geral, represente os dados, O primeiro 
passo é determinar uma função f parametrizada por 0, Aqui não há dúvidas 
de que f(x) = 01+02x seja uma boa função candidata, Chama-se a atenção 
para o fato de que essa função satisfaz as Considerações 5,1 e 5,2. O segundo 
passo é tomar 21 aplicações dessa função. Note que ao fim da Seção 3.7 
foram tomadas apenas duas aplicações. 
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As 21 aplicações podem ser colocadas em formato matricial, da seguinte 
forma: y = X0, sendo y € IR2IX1, X E IR2!X2 e 9 E IR2X!, Usando-se a 
Eq.5.16, chega-se à reta y = —0,9567x 1073 + 7,142x10-1x. A Figura 5.1 
mostra como, de fato, a reta estimada por mínimos quadrados é represen- 
tativa de toda a massa de dados, apesar da presença de ruído. [n| 


tensão de saida por vor de alimentação (VIM) 


FIGURA 5.1: Estimação dos parâmetros de uma reta 
(x) dados medidos e (=) reta ajustada usando o método MQ 
(mg. pos 0). 


Antes de encerrar a presente seção deseja-se notar que o estimador MQ 
mostrado na Eq. 5.16 pode ser escrito na seguinte forma mais geral: 


0=Ay, (5.19) 


sendo que, claramente, para o caso do estimador de MQ tem-se que 
A=[X"X]!XT. Como será visto ao longo do presente livro, a família 
de estimadores lineares do tipo ô = Ay é fundamental na teoria de identi- 
ficação de sistemas, 


5.4 Propriedades do Estimador MQ 


Nesta seção serão estudados diversos aspectos do estimador MQ. As carac- 
terísticas estatísticas deste método serão descritas no próximo capítulo de 
modo mais detalhado. 
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5.4.1 Relação entre o estimador MQ e funções de correlação 


No Capítulo 4 foi visto como a resposta ao impulso A(k) de um sistema tanto 
satisfaz o somatório de convolução (4.10) como a equação de Wiener-Hopf 
(4.11), sendo que esta é mais robusta ao efeito do ruído do que aquela. 

Na seção anterior foi derivado o estimador MQ, que tem boa robustez 
ao ruído, devido ao fato de estimar um conjunto de parâmetros a partir de 
um sistema sobredeterminado de equações. 

No que se segue, h(k) será determinado a partir da Eq. 3.37, utilizando- 
se o estimador MQ. Portanto, usando-se (3.37) para definir um sistema de 
equações, tem-se em forma matricial: 


v(o) u(0) u(-1) ... u(l-m) h(0) 
v(1) % u(1) u(O) ... u(2-n) h(1) 
yN=1) dedica o aiii] | nai 
js UA, (5.20) 


sendo que n; é o número de pontos da resposta ao impulso a ser estimada. 
Do resultado da seção anterior, sabe-se que a estimativa usando-se mínimos 
quadrados é 


h=[UTUJ) UTy. (5.21) 
Desenvolvendo-se a matriz UTU, tem-se 


u(0) u(l) ... u(N-1) 
vi = u(-1) u(0) ... uN-2) 
u(l ã ni) u(2 à ni) er uN- n;) 
u(0) u(=1) ... u(l-ni) 
u(1) u(O) ... u(2-mi) 


UN =) UN=2) o uN=n) | 
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Seu? Esuliu(i = 1) 
UTU Diuli Du(i) Dsuli -1) 
Diui+lomui) Diu -mu(i=1) 
Diulidu(i+1 —m) 
Siuli-Du(i+l ni) 
(5.22) 
Siu(i+l ni)? 


Lembrando-se de que para o caso estacionário (ver Propriedade C.2.10) 


1 N-1 
Puulh) = 7 >, uliu(i =) = raul), (5.23) 
i=0 


vê-se que UTU é proporcional à matriz de covariância (e, às vezes, é assim 
referida) Ruu, OU Seja, 


Tuu(0) Tull) o ruu(ni —1) 
Tuu(1) Tuu(O) Tum —2) 
UTU = N =NRuu. (5.24) 
Tuu(Ni - 1) ruu(ni—2) ê ” ruul0) 


De forma análoga, tem-se 


Tuy(1) 


Tuy(2) 


U'y = N = Nry. (5.25) 


rali) 


Portanto, substituindo-se as duas últimas equações em (5.21) pode-se 
escrever o valor estimado, usando-se o estimador MQ, da resposta ao im- 
pulso, obtido a partir do somatório de convolução, como sendo 


h 


e 
VPiu N Tuy 
Riu Tuy, (5.26) 


H 


que é exatamente a resposta que se obtém se A(k), k = 1,2,... ,dim[Ryu], 
for estimado a partir da equação de Wiener-Hopf (4.11), montando-se um 
sistema de equações com solução única (ver Exemplo 5.2.1). 


Digitalizado com CamScanner 


230 5 0 EsTIMADOR DE MíNiMOS QUADRADOS 


O resultado da Eq. 5.26, além de muito interessante, é importante na 
medida em que permite observar que, dados os sinais u(k) e y(k) de um 
sistema, a resposta ao impulso h(k) pode ser estimada de duas formas dis- 
tintas, a saber: 


1) calculando-se ruu(k) e ruy(k), que têm boa robustez ao ruído por 
causa das propriedades das funções de correlação, e resolvendo-se 
h = Rolruy sendo que Ryy é uma matriz quadrada. Este foi o 
procedimento discutido na Seção 4.2; 


2) usando-se os mesmos sinais de entrada e saída diretamente no soma- 
tório de convolução, montando-se e resolvendo-se o sistema sobrede- 
terminado de equações resultante, usando-se o estimador de mínimos 
quadrados. Ou seja, h = [UTUJIUTy. 


Finalmente, comparando-se as soluções obtidas pelos dois procedimentos 
descritos acima, obtém-se 


h= Rory = [UU U"y. (5.27) 


Portanto, o estimador MQ goza das mesmas propriedades de robustez ao 
ruído que o método de identificação utilizando as funções de correlação, 
conforme descrito no Capítulo 4. 


5.4.2 Ortogonalidade 


Uma das propriedades mais interessantes do estimador MQ é a ortogona- 
lidade. Para ver isso, é conveniente lembrar que se x, y € Z forem vetores 
com a mesma dimensão e z=x-+y, então 


Iz|? = 777 
(x +)” (x + y) 
xx +x'y+tyTx+y'y. (5.28) 


Se x e y forem ortogonais, então x"y = yTx = O (ver Definição A.1.3). 

Portanto, se x .L y, então 
lzlt = xx+y'y 

x |2+ ly Iê, (5.29) 


ou seja, x não tem projeção sobre y e vice-versa. 
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Considere a equação matricial (5.12). No que se segue, será utilizada 
a seguinte nomenclatura 4 = XÔ. Para o estimador MQ pode-se escrever 
(ver Propriedade A.1.3 no Anexo À) 


srelôma) = ôraX (y - Xôma) 

(ex rixTyy" x” (y — x[xT x ixTy) 

yTX per xx” (y — x[x7 x]! x”y) 
yTX(XTXIXTy — yTx(XTxpixTx(xTxpixTy 
0. (5.30) 


] 


O resultado acima pode ser interpretado da seguinte forma. Os vetores y 
e £ são ortogonais quando o correspondente vetor de parâmetros é estimado, 
usando-se o estimador MQ. 

A propriedade da ortogonalidade do estimador MQ pode, também, ser 
ilustrada graficamente conforme mostrado na Figura 5.2. 


E(ômq) 


regressor 1 


0 regressor 2 


Figura 5.2: Propriedade de ortogonalidade do estimador de MQ 


Representação gráfica da propriedade de ortogonalidade do esti- 
mador MQ, para uma superfície de dimensão dois. 


O esquema da Figura 5.2 pode ser entendido da seguinte maneira. Os 
regressores do modelo (5.11) são os elementos do vetor de regressores x. 
Cada regressor “gera” uma coluna na matriz de regressores X quando o 
modelo é considerado sobre a massa de dados. Em termos geométricos, diz- 
se que os regressores geram uma hipersuperfície no espaço, que na Figura 5.2 
é representada pelo plano definido pelo “regressor 1” e pelo “regressor 2". A 
variável dependente, y(k), gera no espaço um vetor de dados ou vetor de 
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observações, y, cuja projeção ortogonal ao plano gerado pelos regressores 
é». A diferença entre tais vetores, É, é chamado de vetor de resíduos e, 
conforme visto na Pigura 5.2, é ortogonal ao plano gerado pelos regressores, 
se os parâmetros forem estimados por mínimos quadrados. 

Como É .L (plano gerado pelas colunas de X), sabe-se de geometria 
analítica elementar que o módulo de É é a menor distância possível entre 
o vetor y e o plano gerado pelos regressores, que é o plano que contém 
y. Portanto, se || € || é a menor distância possível, então || € ||? também é 
mínima. Lembrando que ||€ ||? é precisamente a função custo, minimizada 
pelo estimador MQ, conforme visto na Eq. 5.13, tem-se que os valores die 
Ô» são tais que Ômq = [1 09)”. 

Portanto, a interpretação da Figura 5.2 é a seguinte. Dado um vetor de 
observações y e uma matriz de regressores, X, o estimador MQ determinará 
parâmetros que definem Y de tal forma que j é a projeção ortogonal de 
y sobre a hipersuperfície gerada pelas colunas de X, sendo a matriz de 
projeção P(X) tal que 


y=x0=x[X"x['XTy=P(X)y. (5.31) 


Consegiientemente, parâmetros são estimados de forma que a diferença 
(distância) entre os dados y e j é mínima. A Eq.5.31 mostra que tanto 
quanto Y são lineares nas obsevações y. 

Quando se diz que a diferença entre os dados y e f é mínima, deve estar 
claro que está subentendido que || || é mínima para o conjunto de regressores 
escolhidos. Ou seja, um conjunto diferente de regressores pode resultar em 
uma melhor ou pior aproximação entre y e y. Esse comentário traz à 
tona a questão de como escolher os regressores em modelos. Tal problema 
não tem solução única, mas há algumas ferramentas, como será visto nos 
Capítulos 11 e 12, que podem ser usadas para auxiliar na determinação da 
estrutura do modelo a ser identificado. 


Exemplo 5.4.1, Ortogonalidade de estimadores do tipo Ô = Ay 


O objetivo do presente exemplo é derivar as condições de ortogonalidade 
para estimadores do tipo ô = Ay. Seja a matriz de regressores X e o vetor 
de resíduos É, À condição para que cada regressor seja ortogonal a É, ou 
em outras palavras, a condição para que É seja ortogonal à hipersuperfície 
gerada pelos regressores é 


XTE “e X"(y-3) | 
= X'(y- Xô) 
X"(y- XAy)=0. 


Digitalizado com CamScanner 


5.4 PROPRIBDADES DO EsTIMADOR MQ 233 
Portanto, a condição para se verificar a propriedade de ortogonalidade é 


XTXAy = X'y. (5.32) 


Para o caso do estimador MQ, tem-se A = [XT X]-!X” e, portanto, 


XTX(XT x] xTy X'y 
Xy = Xy, (5.33) 


como já era esperado. D 


5.4.3 O estimador de mínimos quadrados ponderados 


O estimador de mínimos quadrados clássico, apresentado na Seção 5.3, pe- 
naliza igualmente os erros cometidos para cada observação do sinal de saída 
y- Esse fato pode ser claramente constatado observando-se que na Eq. 5.13 
todos os (i) têm o mesmo peso. Em algumas situações práticas poderá ser 
desejado dar pesos diferentes para certos valores de erro. Por exemplo, pode 
ocorrer que por um determinado período de tempo o grau de incerteza das 
medições seja maior e se deseje dar um peso menor aos erros cometidos nesse 
período. Outra situação seria dar menos peso a observações feitas quando 
o processo estivesse operando em regimes dinâmicos (pontos de operação) 
“distantes” daquele para o qual um modelo linear está sendo identificado. 
Nessa situação, ainda que todas as observações tenham a mesma precisão, 
aquelas menos representativas para o ponto de operação em questão podem 
naturalmente receber menor peso. 
Portanto, pode-se reescrever a Eq. 5.13 como 


N 
Jugp =) EliJut(i) = E"WE, (5.34) 
i=l 


sendo que W € IRNXN é uma matriz diagonal cujos elementos são os pesos 
wi, ou seja, W = diag(w w2 ... ww). Seguindo procedimento semelhante 
ao da Seção 5.3, chega-se a 


9Juar 


Ô UXTWXÔ-XTWy). (5.35) 


Igualando-se a expressão acima a zero e resolvendo-se para Ô, tem-se 


ômor = [XTWX]IXTWy. (5.36) 
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Se W for semidefinida positiva, então XTW X também o será e existirá 
a inversa. Vale a pena mencionar que a Eq. 5.36 é o estimador de mínimos 
quadrados ponderados (MQP), e é também válida para o caso em que W 
não é diagonal. 

Apesar de simples, (5.36) representa um aumento em complexidade nu- 
mérica quando comparada com a Eq.5.16. Tal aumento é relativamente 
pequeno se W for diagonal, pois esse caso implica armazenar N números a 
mais. Uma forma simples de operacionalizar este método seria dividir cada 
observação y; e cada vetor de regressores x; por Wi, e usar o estimador 
MQ com as variáveis auxiliares y; = yi/y/W; e x; = x;/y/Wi. 

No caso em que W tiver elementos não nulos fora da diagonal principal, 
pesos não nulos são atribuídos ao produto entre dois valores do erro em ob- 
servações diferentes. Há situações em que será vantajoso levar tais produtos 
em consideração, como será visto no Capítulo 7. O próximo exemplo ilustra 
o uso do estimador MQP. 


Exemplo 5.4.2. Estimação dos parâmetros de uma reta usando MQP 


No presente exemplo será considerado o mesmo problema do Exem- 
plo 5.3.1 e a mesma massa de dados. A diferença é que agora serão atribuí- 
dos pesos diferentes às observações 9, 10 e 11. Portanto, a matriz de pesos 
é definida da seguinte forma: 


W= diag [wm . um] , 


sendo w; = a, à =1,... 812,... 21 e w; =, à = 9,10,11. Dois casos 
foram calculados. No primeiro b = 100a e no segundo b = 10000. A 
Figura 5.3 mostra claramente como escolhendo-se b significativamente maior 
que a é possível dar mais peso a certas observações. Note como para O 
caso b = 1000a a reta é estimada praticamente levando-se em consideração 
apenas as amostras 9, 10 e 11 indicadas na Figura 5.3 com &. [m 


Exemplo 5.4.3. O estimador MQP sem a propriedade de ortogonalidade 


É interessante notar que o estimador MQP é um estimador linear do tipo 
ô = Ay, com A = [XTWX]-!XTW. Portanto, a Eq. 5.32 pode ser usada 
para testar se o estimador MQP satisfaz a condição de ortogonalidade. Para 
esse estimador, tem-se 


X'y 
X'y, (5.37) 


XTXAy 
XXX"WXXTWy 


les lts 


t 
um 
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02] 


015, 


tensão de saída por vor de alimentação (VV) 


FIGURA 5.3: Estimação dos parâmetros de uma reta usando MQP 


(x) dados medidos, e retas ajustadas usando o estimador MQP 
com (—) b = 100a e (— - —) b = 1000a. As três observações que 
receberam peso diferenciado estão indicadas com & (mq pos 0). 


sendo que a condição não é satisfeita para o estimador MQP. Percebe-se 
que na Eq. 5.97 seria errado fazer o seguinte: 


JXXWXIXWy = XY, (5.38) 


uma vez que isso equivaleria a dividir ambos os lados da equação por XT, 
o que é uma impossibilidade, pois X não é uma matriz quadrada. [nm] 


5.5 Estimação de Parâmetros de Modelos ARX 
Usando MQ 


Até o presente, os resultados deste capítulo foram desenvolvidos para um 
modelo geral do tipo y = f(x,0), sendo que algumas considerações foram 
feitas sobre f. Os resultados discutidos têm um caráter bastante geral e 
aplicam-se também ao caso de modelos algébricos. 

Na maioria dos problemas de identificação de sistemas as restrições, que 
vão gerar a equação matricial a ser resolvida por mínimos quadrados, serão 
tomadas a partir de séries temporais, ou seja, de seqiiências de números tais 
como 
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2 = (ul, vo sul), (ND), (5.39) 


em que u(k) são amostras (observações) do sinal de entrada, e y(k), do sinal 
de saída. 
No caso dinâmico, será comum representar o modelo como 


v(k) =b"(k — 1)0 + €(h), (5.40) 


sendo que k indica o instante considerado e W)(k — 1) é um vetor de 
ng = dim[9] variáveis regressoras, 


Pk =1)=[bi qa oo. Pro)”, 


tomadas até o instante k — 1. O modelo (5.40) é dinâmico, mas análo- 
go ao modelo (5.11). Como será visto, principalmente nos próximos dois 
capítulos, há várias peculiaridades quando o modelo sendo identificado é 
dinâmico. A fim de diferenciar bem o caso de modelos estáticos (em cujo 
contexto fala-se de regressão linear) do tipo (5.11) de modelos dinâmicos, 
os regressores destes serão indicados por 1;, em vez de z;. Por exemplo, 
suponha que o modelo dinâmico em questão seja do tipo ARX (ver Eq. 2.44) 
com polinômios (2.40). Nesse caso as variáveis regressoras serão 


Ye = 1) =[y(k=1) e. u(k-ny) u(k = 1)... u(k-ny. 


Portanto, um modelo dinâmico do tipo (5.40), tomado sobre uma massa 
de dados, gera restrições que podem ser representadas por uma equação 
matricial da forma 


y=Vôreê, (5.41) 


em que Y é chamada de matriz de regressores. 

Portanto, todos os resultados até aqui derivados podem ser aplicados à 
equação matricial (5,41), com as devidas alterações na nomenclatura. Por 
exemplo, a função custo (5,13) para modelos ARX pode ser expressa de 
forma detalhada como se segue: 


N 
Juo(ô) = Vw(0,2") = 3" elklk — 1,02 =€"E=[E|P, (542) 
o! 
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sendo que E(KJk= 1,0) é o erro de predição (ou resíduo) cometido no instante 
k, ao fazer a predição com informação apenas até o instante k — 1, usando 
o vetor estimado 0. Além disso, os estimadores MQ e MQP podem ser 
representados, respectivamente, como 


dmg = [UU] !WTy (5.43) 


ômqr = [UTW VW] IyTWy. (5.44) 


Tanto (5.18) como (5.43) são soluções de um problema de regressão 
linear. A palavra regressão indica que a variável dependente, que é des- 
conhecida, pode ser estimada a partir de um conjunto de parâmetros e 
variáveis independentes (os regressores), que são conhecidas. A palavra li- 
near indica que os referidos parâmetros aparecem de forma linear no modelo 
de regressão, ou seja, a variável dependente é uma combinação linear das 
variáveis independentes. Portanto, o termo regressão linear não implica 
necessariamente um modelo dinâmico nem um modelo estático. 

No contexto de sistemas dinâmicos, as variáveis regressoras serão es- 
colhidas de maneira que, ao iterar o modelo, haja uma relação dinâmica 
entre tais variáveis e a saída (a variável dependente). Sabe-se que para 
sistemas de tempo discreto, tal dinâmica aparece como consegiiência da 
diferença temporal que existe entre as variáveis regressoras e a variável 
dependente. Essa propriedade justifica o termo equação de diferença. Por 
exemplo, y(k) = ay(k — 1) + b é uma equação de diferença e, portanto, 
um modelo dinâmico. Essa equação é auto-regressiva porque a variável 
regressora, y(k — 1), é a mesma variável que a saída, mas tomada em ins- 
tante de tempo diferente. Por outro lado, o modelo y = ax + b é estático. 
Mesmo sendo diferentes em sua natureza, ambos os modelos mencionados 
são regressões lineares e, portanto, seus parâmetros podem ser estimados 
usando-se (5.18) ou (5.43), 

As Egs. 5.43 e 5,44 podem ser reescritas da seguinte forma (ver Exerci- 
cio 5.5): 


N o N 
duo = [nova = 1y"(k ) [nv - DO) | (549) 
k=1 k=1 
e 
: jd re 
ôugr = > wiblk= DT (h ) > wib(k 9v09] (540) 
A Eq.5.46 é válida para o caso de a matriz de pesos ser diagonal, ou 


seja, W = diag[w, ... wn]. O Complemento 5.1 tratará do caso em que 
W não é diagonal. 
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A Eq.5.45 pode ser implementada de forma mais fácil do que a Eq. 5.43, 
uma vez que não requer a formação da matriz de regressores W/ € RNXno, à 
sendo que N é o comprimento da segiiência dos dados e np é o número de 
regressores que coincide com o número de parâmetros a estimar, ou seja, 
ng = dim[9]. Chama-se a atenção do leitor para o fato de que, na prática, 
evita-se o uso direto tanto de (5.43) quanto de (5.45), uma vez que ambas 
são sensíveis a problemas numéricos. No Anexo B são apresentados diversos 
algoritmos com boas propriedades numéricas para a solução de problemas 
que envolvem inversão de matrizes, 

Antes de considerar alguns exemplos, é importante notar que as únicas 
restrições feitas sobre os regressores que compõem o vetor Y)(k— 1) em (5.40) 
são: i) essas variáveis são tomadas até o instante k — 1; e ii) tais variáveis 
são lineares nos parâmetros que compõem o vetor a estimar 0. Isso significa 
que (k — 1) pode (ou não) conter termos de saída e/ou de entrada do tipo 
y(k — 1) e u(k — 5), respectivamente. Além disso, pode haver mais de uma 
variável de entrada (exógena) em w)(k—1). Veja os modelos (16.27), (16.28), 
(16.29)-(16.31) e (16.34), como alguns exemplos de modelos multivariáveis 
cujos parâmetros poderiam ser estimados utilizando-se o estimador MQ. 
Finalmente, deve ser notado que no caso de modelos com mais de uma 
saída, o que normalmente se faz é construir um modelo MISO para cada 
saída, como foi feito em (16.34). 


Exemplo 5.5.1. Estimação de parâmetros de um modelo ARX 


Considere o modelo do Exemplo 1.2.12. Aqui será ilustrada a estimação 
dos parâmetros de tal modelo a partir de um conjunto muito restrito de 
dados. Sejam eles 


vík) 
u(k) 


(12,2 11,8 11,6 11,6 11,8 12,2 13,0 14,4 16,2 15,8] 
[2,50 2,50 2,50 2,50 2,50 2,23 2,20 2,20 2,21 2,20). 


O vetor de regressores é 


Wlk-1)=[y(k=1) W(6=2) (6-3) u(b=1) (6 =2]", (5.47) 


e gera o seguinte conjunto de restrições ao longo dos dados acima: 


3 Pelo fato de o modelo ser dinâmico, o número de linhas de Y é N—-max[n, nu], sendo 
Ny € ny OS máximos atrasos nas variáveis saída e entrada, respectivamente. 
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ns 1,6 11,8 2,50 2,50 2,50 

us 11,6 11,6 2,50 250 250 | [0 
12,2 11,8 11,6 2,50 250 250 | | O, 
130 | =| 122 11,8 2,50 2,23 2,60 | | 0; 
A 13,0 122 2,50 2,20 2,23 | | Oy 
16,2 14,4 130 223 2,20 2,20 | | 0; 
158 16,2 144 220 2,21 2,20 


Aplicando-se (5.43), obtém-se 


à 3,4167 
ô, —3,4799 
ô3 |=| 47104 
ôy 1,0410 
ôs —0,6832 


Para se obter estimativas próximas às do Exemplo 1.2.12 seria necessá- 
rio usar um grande número de observações e não apenas dez, como neste 
exemplo. Para finalizar, o vetor de resíduos e o produto interno de cada 
regressor com o vetor de resíduos são, respectivamente: 


E = y-vô 
= [0,3584 —0,1376 —0,4209 —0,0106 —0,1052 0,9467 —0,6006]" 


vTE 


u 


[TE WE WE WaE WoE] 
[0,1661 0,1574 0,0306 0,0296 0,0301]T x 1078, 


O produto interno entre os vetores gerados pelos regressores, Wi, € Os 
resíduos é suficientemente pequeno, confirmando a característica da orto- 
gonalidade do estimador MQ, Erros numéricos na inversão da matriz WTY 
previnem WTE de ser exatamente zero, [a 


Exemplo 5,5,2, Estimação de parâmetros de um modelo contínuo no tempo + 


O presente exemplo é análogo ao de número 5.5.1. A diferença está em 
que o modelo usado neste exemplo é contínuo no tempo. Em particular, 


"Ver ex652 O, 
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deseja-se estimar os parâmetros do circuito da Figura 2.1 a partir de me- 
dições do sinal da fonte v(t) e de medições da tensão no capacitor ve(t) é 
suas respectivas derivadas ve(£) e de(t). 

Conforme discutido no Exemplo 2.2.1, o comportamento do circuito é 
descrito pela equação diferencial 


vlt) = Li a ) 


L, 
Fela = Lie(t) — Roc(t). (5.48) 


1) 
s 
pos 
Ss 

| 


O modelo (5.48) foi simulado com C = 08; L=05;R=02€ 
considerando-se a entrada um sinal de tensão do tipo PRBS (ver Seção 4.3). 
O vetor de regressores e o vetor de parâmetros do modelo (5.48) são, res- 
pectivamente 


à 1,25 
0 | = 0,5 . 
ô; 0,2 


A qualidade dos resultados é excelente devido a dois fatores que não se- 
rão verificados na prática. Em primeiro lugar, nenhum ruído foi adicionado 
aos dados e, em segundo, as derivadas do sinal de saída ve(t) não foram 
estimadas mas calculadas utilizando-se as seguintes equações do circuito 


AR E 
id) = pb 
dO = da) = pel) + puto. 


Na prática, as sucessivas derivadas são, em geral, estimadas numerica- 
mente. Uma maneira de estimar tais derivadas será discutida no Comple- 
mento 10.2. Nesse caso, a exatidão das derivadas será menor do que neste 
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exemplo (e tanto menor quanto maior for a ordem da derivada). Além dis- 
so, haverá ruído no sinal de saída. O processo de estimação de derivadas 
amplifica os componentes espectrais de alta frequência. Contudo, é possível 
estimar parâmetros e obter modelos em tempo contínuo a partir de dados 
medidos (ver os estudos de caso das Seções 16.2 e 16.11). D 


Os Exemplos 5.5.1 e 5.5.2 ilustraram o uso do estimador MQ para ob- 
ter estimativas de parâmetros tanto de modelo discreto como de contínuo. 
Mesmo no caso contínuo, os dados utilizados na estimação são discretos no 
tempo, ou seja, os parâmetros do modelo contínuo foram estimados a partir 
de sinais amostrados. Qual é, portanto, a diferença entre os procedimentos 
seguidos para estimar parâmetros no caso discreto e no caso contínuo? A 
diferença não está na natureza dos sinais utilizados, uma vez que em am- 
bos os casos os sinais são discretos. À diferença reside no fato de que os 
regressores do modelo discreto, bem como o valor da saída dizem respeito 
a instantes de tempo distintos, ao passo que no modelo contínuo, todos os 
regressores e o sinal de saída dizem respeito ao mesmo instante. 


5.6 Complementos 


Complemento 5.1. Estimador MQP com matriz de pesos não diagonal 


A equação (5.46) é válida para o caso da matriz de pesos ser diagonal, ou 
seja, W = diag[w, ... wn]. Por outro lado, a Eq. 5.44 é válida para qual- 
quer matriz W. Neste complemento será derivada uma expressão análoga 
a (5.46) para matrizes de peso não diagonais, mas que sejam simétricas e 
semidefinidas positivas. Nesse caso a matriz de pesos pode ser decomposta 
da seguinte forma (ver Eq. B.6, Anexo B) para um caso semelhante): 


W=LDL, (5.49) 


sendo L uma matriz triangular inferior com 1's na diagonal principal, e 
D = diag[d, ... dn). Portanto, 


Juqr = E WE 
= (y- vô) W (y- vô) 
= (y- vô)" L'DL (y - vô) 


y- Ly )'D (Ly - Lvô) 


ô 
vô) D (yº - wºô), (5.50) 


1 
LA a um 
La 
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sendo y* = Ly o Wº = IN, Comparando-se a Eq. 5.50 com (5.42), pode- 
se dizer que (5.50) equivale ao caso de matriz diagonal de pesos, mas com 
pesos dy dados por (5.49) e operando com sinais filtrados que resultam em 
y* e Wº, Com essas observações em mente, a expressão análoga a (5.46) 6 


N 


-| N 
Ônqp = dot p= 17] [Dave nr) (5.51) 


k=1 h=1 


Complemento 5.2. Estimador MQ para sistemas multivariáveis 


Antes de tratar dos casos SIMO ou MIMO, deve-se observar que os 
resultados derivados até aqui tanto se aplicam para o caso SISO quanto 
para o caso MISO. No caso de r entradas, regressores referentes às entra- 
das 2,...,r, devem ser acrescentados ao vetor de regressores, Assim, por 
exemplo, o vetor de regressores de um sistema MISO pode ser representado 
como se segue: 


WR=1) = [k=1) 0. olb=my) (6 = 1)... unlh = mu)... 
co tr(b= 1)... ur(k— nu)", 


e o vetor de regressores 1)(k — 1) pode ser utilizado nos resultados apresen- 
tados no presente capítulo para sistemas MISO. 

No caso de modelos multivariáveis MIMO, por outro lado, o número de 
equações (e não apenas o número de regressores) muda. Assim, a função 
custo no caso MIMO é 


N 
duo = Db) = VP DOT A) = Vl (652) 


sendo que y(k), YT(k — 1) e O foram definidos no Complemento 2.2. O 
estimador MQ para o caso MIMO, análogo a (5.45), é 


N a RR 
Bug = REP DA ] [a ee mat] (5.53) 


“E fundamental perceber que y f y(k) e W f W(k—1). Por exemplo, y é formado 
tomando-se várias observações escalares no tempo, ao passo que y(k) 60 vetor das 
p observações correspondentes às p saídas, todas tomadas no mesmo instante k. 
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Se a representação definida pelas Eqs. 2.53-2.56 for usada, então a fun- 
ção custo e o estimador MQ são 


N 
Jua = > lly() = 0TW(e =) IP, (5.54) 
k=1 


N =1 N 
ôma = à Dott-nyrt-2] [nua nr), (5.55) 
k=1 k=1 


lembrando que O € IR(P"y+""uXP, ab(k — 1) E IRP"YT MU e y(k) E RP. 


Complemento 5.3. Estimador MQ com restrições 


Uma alternativa interessante em estimação de parâmetros é o estimador 
de mínimos quadrados com restrições MQR. O ponto de partida continua 
sendo a equação matricial (5.41), mas no presente caso deseja-se minimizar 
a função custo €7É restrita por um conjunto de nr restrições que atuam 
sobre os parâmetros. Tal conjunto de restrições pode ser escrito da seguinte 
forma: 


c=80, (5.56) 
em que c € IR""Xl e $ € IR?" X"s são conhecidos. O vetor 8 € IR"ºX! que 
minimiza €7é e ezatamente satisfaz o conjunto de restrições (5.56), ou seja, 


ômor= argmin [EE] 
0:c=50, add 


é dado por (DRAPER; SMITH, 1998): 
ômqr = (4TW)-IWTy — (WTW)-STS(LTW)-1ST]-1(Sôma — c), (5.58) 


em que 'Y é a matriz de regressores e ôma é a solução de mínimos quadrados 
convencional (5,43). Um aspecto muito elegante da solução (5.58) é que não 
se trata de uma solução iterativa. 

Como será visto no Capítulo 15, para algumas representações não- 
lincares a solução (5.58) poderá ser diretamente utilizada para garantir que 
o modelo identificado possua uma característica em estado estacionário pre- 
determinada. O estimador (5.58) é também útil para estimar funções de 
transferência com alguns pólos e zeros predeterminados (ver Exercício 5.12). 
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Leitura Recomendada 


O assunto do presente capítulo é bastante conhecido e, portanto, é discu- 
tido de forma adequada em diversos textos, No contexto de identificação 
de sistemas, o estimador MQ é abordado em (NORTON, 1986; VAN DEN 
Boscn; VAN DER KLAUW, 1994; SÓDERSTRÓM; STOICA, 1989; LJUNG, 
1987) nessa ordem de crescente complexidade e detalhamento. Em parti- 
cular, no Apêndice II de (LJUNG, 1987), é apresentado um ótimo resumo 
tanto do estimador MQ quanto de suas propriedades estatísticas, assunto a 
ser tratado no próximo capítulo. Um texto clássico que descreve o estima- 
dor MQ em grande detalhe, no contexto de regressão linear, é (DRAPER; 
Smirn, 1998). A estimação de parâmetros usando algoritmos adequados 
para a solução paralela de sistemas algébricos de equações foi abordada em 
(Rios NETO; RIOS NETO, 2000). 

Outros dois textos que merecem menção são os livros por Papoulis 
(1984) e Hamilton (1994). Em (PAPOULIS, 1984), o estimador MQ é apre- 
sentado de um ponto de vista de variáveis estocásticas. Por outro lado, a 
abordagem em (HAMILTON , 1994) é tipicamente estatística, com resultados 
a respeito de teste de hipóteses (teste-t e teste-F) sobre 0. 

Com respeito ao estimador MQR, tal estimador foi recentemente usado 
(PEARSON; POTTMANN, 2000) para estimar modelos lineares com ganho 
unitário, sendo que o seu uso foi estendido para modelos polinomiais não- 
lineares em (BARROSO, 2001). Esse assunto será detalhado no Capítulo 15. 
Uma aplicação do estimador MQR em sistemas elétricos de potência foi 
descrito em (GOUVÊA; COSTA, 1998). 


Exercícios 


5.1. Considere o circuito da Figura 5.4 em que há uma fonte de ruído e(t) 
em série com a fonte de alimentação v(t). Suponha que a única forma de 
se fazer medições (tanto de tensão quanto de corrente) seja usando uma 
placa de aquisição de dados que amostra, simultaneamente, as grandezas 
determinadas pelo usuário. Deseja-se estimar os valores de Rj e R2 no 
circuito, sendo que o valor de R3 é conhecido e que e(t) é branco e com 
média nula, Pede-se; 


a) determine um conjunto de variáveis de medida para proceder à esti- 
mação de Ry e Ro; 


b) escolha o tipo de excitação v(t) para o teste; 


c) desenvolva a equação de regressão (do tipo y(k) = "8) e sua corres- 
pondente equação normal; 
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d) mostre como estimar R, e Ro. 


O R 
v(b) R R 


FiGuRA 5.4: Circuito resistivo 


Circuito usado no Exercício 5.1. 


5.2. Seja a seguinte equação de regressão PTy = PTWO + PTe. 
a) Determine ô por mínimos quadrados. 


b) Determine que condição deve satisfazer a matriz PT de tal forma que 
a estimativa determinada acima seja 


ô = arggmin || y — vô |. 


5.3. Seja a seguinte função de transferência: 


bz E boz”? 


EE TUR E ARE li! A 
H( ye l+azl+açz? * 


(5.59) 


Considere a variável 2-1 como representativa do operador de atraso. Mos- 
tre como estimar os parâmetros do modelo acima pelo método de mínimos 
quadrados. Escreva a equação normal e mostre o conteúdo de cada vetor e 
matriz. Indique as dimensões de tais elementos para o caso de estar dispo- 
nível para a identificação uma massa de dados com N pares de observações. 


5.4. Derive a Eq. 5.15. 
5.5. Demonstre que as Eqs. 5.16 e 5.45 são equivalentes. 
5.6. A partir do somatório de convolução 


k 
v(k)=35 h(k = r)u(7), k=0,1,2,... 


7=0 


monte o conjunto resultante de equações se o número de restrições for igual 
ao de incógnitas (h(0),h(1),... jh(n)). Desenvolva também uma solução 
Para o caso sobredeterminado. 
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5.7. Seguindo o desenvolvimento da Seção 5.3, prove a relação (5.36). 


5.8. Usando os dados nos arquivos bfg33 e bfg44 (O estime modelos ARX 
para a planta descrita no Exemplo 3.3.1, Compare o desempenho dos mo- 
delos obtidos com Hi(s) e Ha(s), do exemplo citado. Discuta as possíveis 
razões para a melhora ou piora observada. Quais foram as principais difi- 
culdades em se usar o estimador MQ para obter um modelo ARX? 


5.9. Considere os sinais mostrados na Figura 4.16. Tais sinais correspon- 
dem à entrada e à saída da planta de bombeamento descrita na Seção 1.4 e 
se encontram no arquivo prbsa02 (O. Estime modelos ARX a partir desses 
dados. Compare tais modelos com (1.38) e com os modelos obtidos no 
Exercício 3.12 e no Exemplo 4.6.1. Discuta, baseado nos diferentes procedi- 
mentos seguidos, as vantagens e desvantagens de cada método, bem como 
as principais características dos diversos modelos. Quais foram as principais 
dificuldades observadas? 


5.10. Mostre que se as colunas, 1/;, da matrix de regressores, W, em (5.41) 
forem ortogonais, então a solução (5.43) pode ser escrita da seguinte forma: 


5.11. Considere a resposta ao degrau mostrada na Figura 3.27, descrita 
no Exercício 3.17. Supondo-se que o degrau foi unitário e foi aplicado 
no instante t = 55 segundos, proponha um modelo para o processo. Use 
um método estocástico e os dados do arquivo ensaio6mw O. Compare o 
desempenho do modelo obtido com aquele obtido no Exercício 3.17. Que 
dificuldades persistem no contexto proposto no presente exercício? 


5.12. Determine por simulação a saída da função de transferência 


sl 
= q+9) 


para uma entrada aleatória, com distribuição gaussiana, média nula e va- 
riância unitária. Adicione ao sinal de saída simulado um ruído aleatório 
como a entrada, mas com variância 0,02. Simule o sistema com um tempo 
de integração igual a 0,02. Não decime os dados para proceder à estima- 
ção de parâmetros. Use o estimador MQÊ para achar os parâmetros de um 
modelo com a seguinte estrutura 


8No Capítulo 6 será visto que, no caso de ruído branco adicionado ao sinal de saída, 
o estimador MQ será polarizado. 
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biz +bo 
His) 2 +az+a 


Supondo que se soubesse que o sistema possui integração (como pode ser 
visto em H(s)), use o estimador MQR para garantir que o modelo identifi- 
cado tenha tal integrador. Compare o desempenho dos modelos estimados 


por MQ e MQR. 
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Propriedades Estatísticas de 
Estimadores 


6.1 Introdução 


No capítulo anterior foi apresentado um estimador que minimizava uma Ê 
função de custo definida como o somatório do quadrado dos erros entre =) 
as medições e as predições de um passo à frente. Como visto, a álgebra y 
envolvida é relativamente simples e, o que é ainda melhor, o estimador a 
resultante tem boas propriedades de robustez ao ruído presente nos dados. = 
De fato, foi mostrado que o estimador de mínimos quadrados tem certas t 
propriedades parecidas às de métodos de identificação não-paramétrica por o 
meio de funções de correlação, assunto abordado no Capítulo 4. E 

Ao considerar a hipótese de que há ruído nos dados, e dificilmente ha- 4 
verá uma hipótese mais realista do que esta, é evidente que os parâmetros E 


estimados serão afetados de uma forma ou de outra. Uma maneira simpli- 
ficada de representar um sinal com ruído é considerar que o sinal medido é 
a superposição do sinal ideal com o ruído, ou seja, 


ulk) = yi(k) + e(k). 


Importante notar que, neste caso, o ruído é chamado aditivo ou ruído de 
medição. Um caso mais complicado ocorre quando o ruído afeta a própria 
dinâmica do sistema que está produzindo os dados. Neste último caso diz-se 
que há ruído dinâmico ou multiplicativo afetando o sistema. 

Considere, mais uma vez, o caso em que o valor medido é a soma do 
valor ideal com o ruído, ou seja, y(k) = y'(k)+e(k). Ainda que y'(k) perma- 
neça o mesmo durante diversos testes, pelo fato de e(k) variar, pois é uma 
variável aleatória, é de se esperar que parâmetros estimados usando-se y(k) 
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também variem. Surge então uma pergunta: se forem feitos vários testes no 
mesmo sistema e, para cada conjunto de dados, parâmetros forem estima- 
dos, o que pode ser dito sobre tais estimativas em média? Pelo fato de cada 
teste ter realizações diferentes do ruído, é de se esperar que haja alguma 
variação entre os parâmetros estimados a partir dos dados de cada teste. 
Entretanto, se o processo for invariante no tempo e o ruído for estacionário, 
é natural que as diferenças dos diversos conjuntos de parâmetros estimados 
sejam pequenas. Mas quão pequenas? Ou ainda, se tais parâmetros fossem 
considerados como variáveis aleatórias, quais seriam as suas características 
estatísticas? 

Neste capítulo discute-se esse assunto e procura-se dar respostas para as 
perguntas acima. Como será visto, em alguns casos será possível encontrar 
respostas razoavelmente satisfatórias, mas em outros casos elas serão um 
tanto quanto difusas. A maior parte deste capítulo utilizará o estimador de 
mínimos quadrados como o meio para apresentar e discutir certos conceitos. 
Essa escolha se justifica por dois motivos: a álgebra envolvida é relativa- 
mente simples e, sem dúvida, o estimador MQ é um dos mais usados na 


prática. 


6.2 Polarização de Estimadores — Conceitos 


Seja O um vetor de parâmetros e Ô seu valor estimado. A polarização 
(tendência ou viés; ou bias em inglês) é definida como 


b = Efô] - 0. (6.1) 


Note-se que Ô é uma variável aleatória, e que 8 é, pelo menos em prin- 
cípio, uma variável determinística (ainda que não se conheça o seu valor). 
Portanto, a diferença Ô — O 6 também uma variável aleatória. Devido ao 
fato de que apenas uma realização de uma variável aleatória não caracteriza 
tal variável, é mais significativo utilizar o valor médio, ou seja, a esperança 
matemática E[0]. Na realidade, a fim de caracterizar uma variável aleatória 
é necessário utilizar a função de probabilidade, mas nesta seção a esperança 
matemática basta. Portanto, considerando 0 determinístico, a Eq.6.1 pode 
ser reescrita como b = E[ô — 0] (ver Propriedades 0.2.1 e C.2.2), 
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Exemplo 6.2.1. Polarização de um estimador de ganho * 


Considere um sistema cuja saída y(k) inclui ruído de medição e(k) da 
seguinte forma: 


uk) = Ku(k) + e(k), k=1,2,...N, (6.2) 
sendo que u(k) é a entrada do sistema e K é o ganho. Supondo que o ruído 


não afete a entrada u(k), uma forma de se estimar o ganho K a partir dos 
dados de entrada e saída do sistema é calcular 


21 (uk) 
k=5 (> sa) , (6.3) 


A consegiência de se usar o somatório é, conforme discutido no Exem- 
plo 4.2.1, reduzir o efeito do ruído no sinal medido y(k). A polarização 
deste estimador pode ser determinada a partir da definição como se segue: 


b = (tj - 4 = 1 (Sub eb) 


Pa ul) 
É Ele(k)] 
» ver dt) A 
1X eo 
= NX ul (6.4) 


No desenvolvimento acima foi utilizada a propriedade de que a espe- 
rança matemática de uma soma é a soma das esperanças matemáticas (ver 
Propriedade C.2.2). Assumiu-se também ergodicidade, o que permitiu subs- 
tituir a esperança matemática pela média temporal, que foi indicada pela 
barra sobre e(k). Da última equação percebe-se que a polarização não de- 
pende do valor do parâmetro estimado K e nem tampouco do número de 
observações N (note que N aparece tanto no limite superior do somatório 
como no denominador). Os dois valores que influem na polarização são a 
média do ruído e(k) e o valor médio do sinal de entrada. Neste exemplo, a 
única maneira de não sofrer polarização é garantir que o ruído tenha média 
nula, ou seja, que não haja nenhum erro sistemático (offset) na medição 
y(k). Por outro lado, uma forma de diminuir a polarização seria aumentar 
o valor médio do sinal de entrada u(k), o que equivale a melhorar a relação 
sinal/ruído. [a] 


!NORTON, 1986. p. 89. 
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A seguir será considerada a polarização do estimador do vetor de pará- 
metros de um modelo dinâmico do tipo y(k) = W”(k — 1)0 + e(k), que é 
linear em 0. Como visto no capítulo anterior, um modelo desse tipo gera 
um conjunto de equações da forma y = YO +e, a partir do qual pode-se 
estimar o vetor de parâmetros da seguinte maneira: 


ô=aAy, (6.5) 
sendo que Y é a chamada matriz de regressores e A é uma matriz cujos 


elementos dependem dos regressores de forma complicada. Utilizando a 
definição (6.1) e o resultado da última equação, tem-se 


b E[4y] - 0, 
EIA(VO +6)) - 0, 
BI(AY - 10) + B(4e), 


= E(AY- IJ + EfAe), (6.6) 


sendo que 0 foi considerado determinístico. Da Eq.6.6 torna-se claro que, 
para que a polarização seja nula (b = 0), as seguintes considerações preci- 
sam ser satisfeitas: 


Consideração 6.1. A matriz A deve ser tal que AY = T. 


Consideração 6.2. A e e são estatisticamente independentes. Portanto, | 
E(4e) = E(AJE[e). | 


Consideração 6.3. O erro deve ter média zero, isto é, Efe] = 0. 


Mais adiante serão consideradas as implicações de cada uma dessas con- 
siderações. Neste ponto, vale a pena observar que a Consideração 6.1 diz 
respeito ao estimador em si, ao passo que as Considerações 6.2 e 6.3 referem- 
se à estrutura do modelo e aos dados. Também deve ser notado que a Con- 
sideração 6.2 implica que o modelo é capaz de explicar o comportamento | 
dinâmico nos dados. Em outras palavras, o modelo YTô consegue explicar | 
toda a informação (correlações) contida nos dados, y. Uma justificativa | 
mais detalhada e precisa para esta afirmativa será discutida na Seção 7.2. 

As Considerações 6.2 e 6.3 podem ser substituídas pela seguinte consi- 
deração alternativa: 


Consideração 6.4. O vetor e é ortogonal às linhas de A. Portanto (ver 

Definição A.1.3), E[4e] = 0. ! 
a 

Digitalizado com CamScanner 


6.3 POLARIZAÇÃO DO EsTiMADOR MQ 253 


Em outras palavras, a Consideração 6.4 é uma interpretação geométrica 
das Considerações 6.2 e 6.3. é de fundamental importância compreender a 
origem da polarização em estimadores da forma (6.5), pois isso permitirá 
entender como é que os estimadores não polarizados contornam o problema 
da polarização. Nesse estudo, as Considerações 6.2 a 6.4 têm um papel 
central. Na próxima seção será visto como as quatro considerações acima 
se manifestam (ou não) no contexto do estimador MQ. 


6.3 Polarização do Estimador MQ 


Dos resultados do capítulo anterior é fácil ver que o estimador de mínimos 
quadrados é um estimador linear do tipo O = Ay, sendo que 


A=[uTy ly”, (6.7) 


Consegiientemente, a Consideração 6.1 é satisfeita por este estimador 
(ver Exercício 6.2). Por outro lado, a Consideração 6.3 não é muito restri- 
tiva, pois se e(k) não tiver média zero, um termo constante (normalmente 
1) pode ser incluído no vetor de regressores, e o valor da média poderá ser 
estimado juntamente com os demais parâmetros (ver Exercício 6.3). Nesse 
caso, como a média também será estimada, ela não aparecerá nos resíduos, 
e o problema passará a satisfazer a Consideração 6.3. Em vista dessas consi- 
derações, a condição mais relevante para o estimador de mínimos quadrados 
é a Consideração 6.2. 


Exemplo 6.3.1. Polarização do estimador de MQP 


Neste exemplo será investigada a polarização do estimador de mínimos 
quadrados ponderados (MQP). Usando a definição (6.1) 


by = Elô,]-0, 
e E[Awy] “3 9, 
= ElAy(VO+e)|-0, 
= El(AwY — 1)0] + ElAvel, 
= ElAyU— I]0 + ElAve), (6.8) 


sendo que Ay = [UTWW]"! WTW e W é uma matriz de pesos constantes 
(ver Seção 5.4.3). Comparando-se as Eqs. 6.6 e 6.8, fica claro que as mes- 
mas Considerações 6.1 a 6.3, mas com A = Ay, devem ser satisfeitas para 
garantir que o estimador não seja polarizado. Como não é possível se obter 
um outro vetor de resíduos que também seja ortogonal à superfície gerada 


Digitalizado com CamScanner 


2 6 PROPRIEDADES ESTATÍSTICAS DE ESTIMADORES 


pelos regressores, bw já O mesmo que e seja branco, a menos que W seja 
uma matriz identidade. Ou seja, se e for ruído branco, então não existe 
€0w) X E (ômq) tal que by = 0. Em outras palavras, o mesmo vetor e — 
que era ortogonal às linhas de A (satisfazendo as Considerações 6.2 e 6.3. 
ou, alternativamente, a Consideração 6.4) — não será ortogonal às linhas 
da matriz Aw. De fato, como será visto na Seção 7.3, uma solução do tipo 
Ay = [WTWW]"! WTW não resultará em polarização quando e for colorido 
e quando a matriz W for a inversa da matriz de covariância de e. [| 


6.3.1 Uma interpretação de polarização 


Da Eq.6.1 fica evidente que a polarização é o desvio entre o valor espe- 
rado de uma determinada variável aleatória (a variável estimada) e uma 
variável determinística (o valor real), ainda que esta não seja conhecida. O 
objetivo da discussão a seguir é ilustrar como a polarização é induzida no 
estimador de mínimos quadrados e, assim, começar a levantar questões que 
serão úteis no estudo de estimadores não polarizados, que serão estudados 
no Capítulo 7. 

Suponha que um determinado sinal y(k) é descrito pela seguinte expres- 
são linear nos parâmetros: y(k) = WpT(k — 1)0 + e(k). Aplicando-se essa 
estrutura ao longo de um trecho (ou uma janela) de dados, obtém-se um 
conjunto de equações (restrições) que pode ser expresso na forma matri- 
cial y = Yô +e. Se o estimador MQ for usado para estimar o vetor de 
parâmetros, o vetor de resíduos será Eq = Y — Ymq =Y — Yômq. Logo, 


êxq = y- tôma 
= VO+e- Vôma 
v(9 - duq)+e. (8.9) 


Sabe-se que os resíduos resultantes do estimador de mínimos quadrados | 
são ortogonais à hipersuperfície gerada pelos regressores (ver Seção 3.4.2), 
que são as colunas da matriz Y. Portanto, usando-se a Definição A.1,3 e e 
resultado (6.9), tem-se: 


Vémq = 0 ú 
= vwTy(9 — duq) + VTe. (610) 


Manipulando algebricamente a equação acima, obtém-se 
] 
ad 
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WTe = WTY(dmg — 0) 
ElvTe]) = E(YTY(ômq — 0)] 
vTYEl(ômg — 0)), 


sendo que no último passo foi considerado que a matrix WTW é determinís- 
tica. Finalmente, da última equação e da definição (6.1), chega-se a 


byo = [E"W]-"E(V”e], (6.11) 


sendo que bmq é à polarização do estimador de mínimos quadrados. A 
Eq.6.11 revela que, para que a polarização seja nula, é necessário que não 
haja correlação entre o vetor de erro, e, e nenhum dos regressores (ver Exer- 
cício 6.4). Além disso, tal vetor deve ter média nula (ver Considerações 6.2 
e 6.3). Em termos geométricos, é necessário que o vetor de erro? seja orto- 
gonal à hipersuperfície gerada pelos regressores (ver Consideração 6.4), ou 
seja, 


E[YTe] =0. (6.12) 


Baseando-se na Eq. 6.12, é possível dizer que os índices de correlação cruzada 
entre o vetor e e cada regressor do modelo, que geram as colunas da matriz 
'Y, são nulos, conforme a definição em (4.3). 

Há uma diferença entre o resultado discutido no último parágrafo e os 
resultados representados na Figura 5.2, Apesar de sutil, essa diferença é de 
fundamental importância para o bom entendimento do problema de polari- 
zação do estimador MQ. Na discussão que sucede a Figura 5.2, observa-se 
que o vetor de resíduos € é ortogonal à hipersuperfície (um plano na Figu- 
ra 5.2) gerada pelos regressores, Esse fato é uma conseqgiiência da proprie- 
dade de ortogonalidade do estimador MQ. Por outro lado, a Eq. 6.12 é uma 
condição que deve ser satisfeita pelo vetor de erro (que inclui o ruído nos 
dados, dinâmica não modelada, não-linearidades, e assim por diante) para 
que o estimador MQ não seja polarizado, A relação entre a propriedade e a 
condição acima mencionadas será discutida de forma mais detalhada ainda 
no presente capítulo e também no Capítulo 7, 

Tanto pela Eq. 6.11, quanto pelos resultados descritos na Seção 6.2, fica 
claro que quando e(k) for ruído branco, a polarização do estimador de MQ 

2É fundamental perceber que aqui fala-se do erro e e não de resíduo é. Note-se que 


o estimador MQ força o vetor É a ser ortogonal à hipersuperfície gerada pelos 
regressores. 
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será nula. Uma observação interessante que pode ser feita à luz da Eq. 6.11 
é que, se a polarização não for nula, ela será proporcional-a: i) [(WTWj-! 
que, como será visto ainda neste capítulo, tal matriz está relacionada com 
a variância do estimador MQ, e ii) a correlação entre o vetor de erros e os 
regressores (ver Exercício 6.4). O exemplo a seguir discute o caso em que o 
erro não é independente dos regressores nem tem média nula. 


Exemplo 6.3.2. Polarização devida à tendência 


Seja um modelo linear nos parâmetros y(k) = W”(k — 1)9 + e(k). 
Supondo-se que o erro seja do tipo tendência (drift), mais um termo alea- 
tório 


elk) = ak + B + v(k), (6.13) 


sendo que k = 1,2,... indica os instantes de amostragem t = Ts,2Ts,..., 
v(k) é uma variável aleatória não autocorrelacionada (ruído branco) e a e 
£ são constantes. Portanto, é fácil constatar que e(k) não tem média nula. 
O valor da saída medido no instante k é representado da seguinte forma: 


u(k) = b”(k — 1)0 + ok + B + v(k). 


Existe relação entre e(k) e e(k — 1). Para ver isso, a Eq.6.13 pode ser 
utilizada para escrever 


e(k-1) 


afk = 1)+B+v(k-1) 
ak +B+vu(k) +v(k-1)-a—v(k) 
eh) +u(k— 1) - a — v(k). S (6.14) 


O] 


Suponha que o modelo seja auto-regressivo com um dos regressores sendo 
y(k — 1). Por comparação com o caso anterior, tem-se 


u(k — 1) WT(k-2)0 +e(k = 1), 


WT(k- 20 +e(h) +U(k=1)-a—v(k), (6.15) 


em que (6.14) foi utilizada na última equação, que revela o fato de o regressor 
y(k=1) estar correlacionado com e(k). Consequentemente, E[Y"e] É 0 e, de 
acordo com a Eq.6.11, o estimador de mínimos quadrados será polarizado 
neste caso. ja] 
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Exemplo 6.3.3. Sinais reais com tendência 


No Exemplo 6.3.2 foi mostrado como sinais com tendência induzem po- 
larização no estimador MQ. A Figura 6,1 mostra exemplos de sinais reais 
com tendência. 


1] 
L 


FIGURA 6.1: Sinais reais com tendência 


O gráfico superior é uma série de saturação de oxigênio dissolvido 
no sangue de um humano (RIGNEY et al., 1994). À escala vertical 
está em unidades arbitrárias. O gráfico inferior é uma série de 
vazão de ar numa planta piloto de flotação em coluna (SARAIVA, 
1998). 


No primeiro gráfico da Figura 6.1 6 mostrada uma série de saturação 
de oxigênio dissolvido no sangue de um humano (RIGNEY et al., 1994). 
Presume-se que a tendência neste caso é uma conseqiiência do drift dos 
amplificadores usados no tratamento do sinal vindo do sensor, Esse tipo de 
efeito é muito comum na prática. No segundo gráfico da Figura 6.1 mostra- 
se o sinal de vazão de ar numa planta piloto de flotação em coluna (SARAIVA, 
1998). Neste caso, observou-se que, à medida que a planta opera, o aerador 
entope gradualmente, dificultando a passagem do ar. Consegilentemente, 
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a vazão diminui conforme mostrado na figura. Um outro efeito, bastan- 
te comum na prática, é o aparecimento de tendências devidas a variações 
lentas de temperatura. Sinais com tais tendências induzem polarização no 
estimador MQ. Uma solução em tais casos é a remoção da tendência nos 
dados. Uma forma simples de eliminar a tendência é ajustar um polinômio 
(por exemplo uma reta) usando-se técnicas de regressão linear e tomar a 
diferença entre os dados medidos (com tendência) e o polinômio estimado. 
Tais diferenças passam a ser os novos dados, sem tendência. [a] 


6.3.2 Polarização em modelos ARX 


A polarização de um determinado estimador depende, em grande parte, da 
parametrização do modelo cujos parâmetros estão sendo estimados. Em 
particular, a forma com que o ruído aparece nos modelos determina as 
características de polarização do estimador que está sendo usado. Nesta se- 
ção, serão considerados modelos ARX e modelos de erro na saída, conforme 
definidos nas Eqs. 2.44 e 2.50, respectivamente. 

Seja um modelo ARX do tipo mostrado em (2.44). Tal modelo pode ser 
representado na forma y(k) =p” (k — 1)0 + v(k), com 


WT(k — 1) 
9 


[ulk = 1)... ulk — ny) u(k — 1)... u(k — mu) 
[ar ...an, bi... bn)" (6.16) 


Aplicando-se o modelo acima ao longo dos dados, gera-se a equação 
matricial y = WO + v. A matriz de regressores W é usada para determinar 
a matriz 4, conforme (6.7). Portanto, a condição para que o estimador 
MQ seja não polarizado é que os regressores e v não sejam correlacionados, 
conforme mostrado em (6.11). Para modelos do tipo (2.44) essa condição é 
satisfeita pelo fato de o erro na equação, V, ser branco. 

A fim de fazer uma análise semelhante para o estimador MQ em conjunto 
com o modelo de erro na saída (2.50), é conveniente escrever tal modelo na 
forma de um modelo ARX, ou seja, 


F(a)y(k) = Bla)u(k) + e(k), (6.17) 


sendo que e(k) = F(g)v(k) e v(k) é branco. A menos que F(g) = 1, e(k) 
não será ruído branco e consegiientemente e(k) estará correlacionado com 
alguns regressores, resultando em polarização. Portanto, em modelos ARX 
erros de regressão brancos não resultam em polarização do estimador MQ, 
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ao passo que a adição de ruído branco em modelos de erro na saída (ruído 
de medição) acarreta em polarização do estimador de MQ. 


Exemplo 6.3.4. Polarização em modelos de erro na saída e ARX 


Neste exemplo, um modelo ARX e um modelo análogo, do tipo erro 
na saída, foram simulados. Ruído branco foi acrescentado em cada caso e 
o estimador MQ foi então utilizado para estimar os parâmetros. Ou seja, 
no modelo ARX o ruído branco entra como erro de regressão, ao passo 
que para o modelo de erro na saída o ruído branco é acrescentado como 
erro de medição. Esse procedimento foi efetuado 200 vezes, com realizações 
distintas dos sinais de ruído. Assim, o modelo ARX simulado foi 


v(k) = Lôy(k — 1) — 0, 7U(k — 2) + 0,5u(k — 1) + v(k), 


sendo que u(k) e v(k) são sinais aleatórios com distribuição normal, média 
nula e variâncias o? = 1 e o2 = 0,04. O modelo de erro na saída usado foi 


] 


w(k) 
FU) 


Lw(k — 1) — 0,7w(k — 2) + 0,5u(k — 1) 
w(k) + v(k), 


sendo u(k) e v(k) definidos da mesma forma que para o modelo ARX. O 
procedimento seguido no caso do modelo de erro na saída consiste de simular 
a função de transferência do processo 


B(g) 0,57! 


H(g="[L=——00— 
(a) FP(g) 1-15g-1 +09"? 


(6.18) 


excitada pela entrada u(k), gerando assim w(k), e posteriormente acrescen- 
tar o ruído v(k), ponto a ponto. 

O resultado de se estimar 200 vezes os parâmetros gerados pelos modelos 
acima é mostrado na Figura 6.2, Percebe-se que os parâmetros estimados do 
polinômio F(q) revelam forte polarização do estimador, O único parâmetro 
de B(q) do modelo de erro na saída não parece ser fortemente afetado pela 
polarização. 
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FIGURA 6.2: Polarização em modelos de erro na saída e ARX 


Histogramas de parâmetros estimados usando-se o estimador MQ. 
Os gráficos (a), (b) e (c) referem-se ao modelo de erro na saída 
e os gráficos (d), (e) e (f) referem-se ao modelo ARX. Os valores 
reais dos parâmetros são: (a) e (d) 01 = 1,5; (b) e (e) 04 = —0,7 
e(c) e (f) 04 =0,5 (bias6i O). 


A análise de resíduos dos modelos acima é feita no Exemplo 13.4.1 e 
confirma que no caso do modelo de erro na saída os parâmetros são estima- 
dos via MQ com tendência (polarização), mas para o modelo ARX o mesmo 
estimador não é polarizado, [| 


O próximo exemplo é similar ao Exemplo 6.3.2, mas mostra como surge 
a polarização em modelos ARX, por causa de erros de regressão do tipo 
ruído colorido AR. O caso de polarização devida ao ruído MA é discutido | 
no Exemplo 7.2.1, 
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Exemplo 6.3.5. Polarização devida a ruído AR e regressores y(k — 1) 
Seja o modelo ARX 
u(k) = ay(k— 1) +bu(k — 1) + e(k). (6.19) 


Supondo-se que e(k) seja uma variável aleatória autocorrelacionada de 
acordo com 


e(h)=ce(k — 1) +v(k), (6.20) 


sendo que v(k) é ruído branco, ou seja, ryu(7T) = 0, VT £ O. A Eq.6.20 
indica que uma forma de descrever um sinal colorido é por meio de um 
modelo do tipo auto-regressivo. Substituindo (6.20) em (6.19), resulta em 


ylk) =ay(k— 1) +bu(k— 1) +ce(k — 1) + v(k) (6.21) 
e, obviamente, 
ylk-1)=ay(k-2)+bu(k — 2) +e(k — 1). (6.22) 


Substituindo-se (6.22) em (6.21), obtém-se 


vt) = (aloy(k=2)+bu(k = 2) +elk= 0] +bu(k = 1)) 
+ee(k = 1) + v(h). (6.23) 


A última expressão gera uma equação matricial do tipo y = YO +e, 
sendo que os termos entre chaves compõem a matriz de regressores Y, e 
a parcela entre colchetes gera a primeira coluna da matriz W. Note que 
o vetor e está correlacionado com a matriz de regressores por causa dos 
termos sublinhados. É precisamente essa correlação que implica E[4e] 4 0, 
sendo que para o estimador MQ A = [WTW]-hy”, 

Deve ser salientado que se o erro e(k) na Eq, 6,19 fosse um ruído branco, 
a equação (6.20) se reduziria a e(k) = v(k). Conseqientemente, o termo 
ce(k—1), que se encontra fora dos colchetes na Eq, 6.23, deixaria de existir. 
Portanto, haveria e(k — 1) dentro dos colchetes, ou seja, na matriz dos 
regressores, e e(k) fora de tal matriz, Como e(k) é branco, ree(1) = 0, ou 
seja, não há mais correlação entre a matriz de regressores e o que está fora, 
eliminando-se o problema de polarização, como esperado. 

Finalmente, nota-se que a polarização do estimador MQ no presente 
exemplo é devida não apenas ao erro de regressão ser autocorrelacionado 
do tipo AR, mas também ao fato de o modelo incluir regressores envolvendo 
a saída do processo, em particular y(k — 1). Se o modelo não tivesse tal 
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regressor, a Eq. 6.23 não teria a parcela entre colchetes e, portanto, poderia 
ser reescrita como 


uk) = du(k= 1) +ce(k = 1) +v(k) 


bu(k — 1) + e(k), 


) 


que seria igual ao modelo inicial (6.19) sem o regressor y(k — 1). Nesse caso, 
o estimador MQ estimaria b sem polarização. [m| 


A polarização pode ser vista como o resultado do estimador “forçar” 
7*€ = 0 (propriedade de ortogonalidade entre regressores e resíduos), sendo 
que We É 0. Em outras palavras, a polarização surge em função do conflito 
que existe entre a propriedade do estimador de mínimos quadrados, WTE = 
0, e a propriedade do erro de regressão, YTe £ O (ver a condição (6.12) que 
o ruído deve satisfazer). 

A fim de representar o problema da polarização geometricamente, con- 
sidere o caso 


y=Vo+e, (6.24) 


sendo que e não é ortogonal aos regressores, ou seja, WTe 4 0. Isso está 
representado geometricamente na Figura 6,3. 

Deve ser notado que sempre que o erro não for ortogonal aos regressores 
então É f e, e os valores estimados [0,1 02)” serão sistematicamente dife- 
rentes dos valores reais [0, 02)", indicando que nesse caso o estimador MQ 
é polarizado, 


Fiouna 63: Polarização do estimador de MQ 
Polarização do estimador MQ quando o erro não é ortogonal aos 
regressores. Nesse caso os parâmetros corretos são [91 03], e o 
estimador MQ determina [03 0,3)". 


” 
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Para evitar tal conflito será necessário operar uma transformação no 
modelo original de forma a se obter y*(k) = *”(k— 1)9* +e(k)*, sendo que 
o asterisco indica grandezas transformadas, e W*Te* = 0. Esse assunto será 
visto com detalhes no Capítulo 7, em que serão estudados, de forma mais 
detalhada, algoritmos que trabalharão com tais grandezas transformadas. 
Esses algoritmos são chamados de estimadores não polarizados. 


6.3.3 O problema de erros nas variáveis 


Nesta seção será considerado o caso em que tanto a saída quanto a entrada 
são observadas com erro, conforme ilustrado na Figura 6.4, ou seja, 


u(k) 
u(k) 


u(k) + vulk), 
vi(k) + eylk), (6.25) 


sendo que o índice “i” indica os sinais ideais, ou seja, sem ruído. 


FiGuRA 6.4: Ruído de observação na entrada e na saída 


Ambos os sinais utilizados pelo estimador, u(k) e y(k), estão con- 
taminados com ruído de observação. 


Matematicamente, tem-se 


Aly) = Blou'(k) 
A(a) [y(k)-ey(k)] = Ba) [u(k) -vu(R)] 
Aou(k) = Blau(k)HA(a)F(a)vy()-Bla)vu(k)), (6.26) 


sendo que w(k) e vu(k) são ruídos brancos não correlacionados entre si. 
Os parâmetros do modelo serão estimados usando-se a seguinte equação de 
regressão: 


A(a)y(k) = Bla)u(k) + e(k), (6.27) 


de maneira a se ter uma estimativa do sistema B(a)/Á(q). Comparando-se 
as Egs.6.26 e 6.27, percebe-se que o erro na equação de regressão não é 
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branco, pois apesar de vy(k) e vu(k) serem brancos, assume-se que os filtros 
A(a)Pa) le B(g) £1. 

O uso do estimador MQ para estimar os parâmetros do modelo (6.27) na 
presença de erros de observação nas variáveis de entrada e saída resultará em 
polarização. A justificativa para isso é, conforme visto na Seção 6.3.1, o fato 
de o erro e(k) estar correlacionado com os regressores do modelo. Há, nesse 
caso, um conflito, pois os resíduos £(k) do modelo A(g)y(k)=B(g)u(k)-+E(k) 
são, graças à propriedade de ortogonalidade do estimador MQ, não corre- 
lacionados com os regressores. 

Um aspecto importante a se notar aqui é que, como será visto no próximo 
capítulo, é possível evitar a polarização utilizando-se um estimador estendi- 
do de mínimos quadrados quando só houver erro de observação na saída. A 
presença de erros de observação na entrada resulta no conhecido problema 
de erros nas variáveis. Mesmo o estimador estendido de mínimos quadra- 
dos é polarizado em problemas de erros nas variáveis (ver Seção 7.2.1). 
Uma solução, ainda que não seja geral, para esse problema envolve o uso 
do estimador de mínimos quadrados totais (MQT), a ser apresentado no 
Complemento 7.1. 

Uma situação comum na prática é ilustrada na Figura 6.5. Nesse caso, 
para a estimação de parâmetros, utiliza-se como sinal de entrada o comando 
enviado ao atuador, ui (k). Entretanto, é possível que o atuador implemente 
u(k) = ui(k)+vu(k), em vez de u(k). Portanto, o sistema é de fato excitado 
por u(k) e ao erro vu(k) dá-se o nome de ruído de autador. 


ui(k) 


FIGURA 6.5; Entrada contaminada com ruído no atuador 


O sinal de entrada está contaminado com ruído de atuador. O 
algoritmo, entretanto, usa o sinal ideal u!(k). O sinal de saída está 
contaminado com ruído de medição. Nesta situação, o estimador 
MQ não será polarizado se A(q)F(q)vy(k) + B(a)vu(k) for ruído 
branco, 


Matematicamente, tem-se 


A(avi(k) = Blau(k) 
A(a) [y(k)=ev(h)] = Bla) [u!(k) + val) 
Adult) = Bl)uk)+A(g) Pla) (6) +B(a)rulk). (6.28) 
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Portanto, o estimador MQ será polarizado nos casos em que a parcela 
A(a) F(g)v,(k) + B(a)vu(k), que é o erro de regressão, não for um sinal 
branco. Isso se verificará se A!g) £ F(a) ou B(q) £ 1. Como em ge 
ral essa parcela não será ruído branco, o estimador MQ normalmente será 
polarizado em tais casos. 

Como será visto no próximo capítulo, o estimador estendido de mínimos 
quadrados será não polarizado neste caso. Isso é possível uma vez que ui(k) 
não depende de v,(k), em outras palavras, apesar do ruído de atuador 
afetar o erro de regressão, ele não está correlacionado com a entrada, como 
acontecia no problema de erros nas variáveis. 


6.4 Covariância de Estimadores 


Antes de desenvolver uma expressão para a covariância de estimadores, vale 
a pena mencionar alguns conceitos que serão usados. Detalhes podem ser 
encontrados no Anexo C. 

A variância de uma variável escalar é definida como sendo 


var[z] = o2 = E [(z — Elz])?), (6.29) 


sendo que E[:) indica a esperança matemática. Para um vetor x € IR”, a 
matriz de covariância tem dimensão n x n e é definida como 


cov[x] El(x — Elx)(x — Ebx))”] 


= Epoc”] — ElxElx"]. (6.30) 


Importante notar que, por construção, a matriz cov[x] é simétrica e 
semidefinida positiva. Também, a matriz de covariância do vetor Cx, sendo 
que C E IR"X" é uma matriz determinística, é (ver Exercício 6.9) 

cov[Cx] = Ccov[x]CT. (6.31) 

O valor quadrático médio de um escalar x é 

vqm(z] = Elz?), (6.32) 
e a matriz de valor quadrático médio de um vetor x é 
mms[x] = E [xx”], (6.33) 


sendo que a sigla “mms” vem do inglês matriz mean square. 
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6.4.1 Variância de estimadores do tipo Ô = Ay 


Quando se utiliza um estimador para determinar o valor de um vetor de 
parâmetros Ô a partir de uma massa de dados, uma questão fundamental é 
tentar responder a pergunta: quão perto está o valor estimado daquele que 
seria considerado o valor correto? Como o vetor estimado é uma grandeza 
estocástica, ou seja, não tem um valor puramente determinístico, a diferença 
entre o valor estimado e o valor correto precisa ser estimada em termos 
médios. A polarização do vetor estimado é uma forma de quantificar tal 
diferença (ver Eq. 6.1). 

Como mencionado anteriormente, o ideal é que a polarização seja nula, 
mas mesmo neste caso não há nenhuma garantia de que uma determina- 
da estimativa Ô esteja satisfatoriamente perto do valor correto, 0 (inde- 
pendentemente do que for considerado satisfatório), conforme ilustrado na 
Figura 6.6. 


9 20 «4 0 1 2 4 
“valores de eta 


Figura 6.6: Histograma de um parâmetro estimado 


Histograma de valores estimados de um parâmetro com valor 0,2. 
Mesmo que o estimador utilizado não fosse polarizado (conforme 
a figura), percebe-se que valores relativamente afastados de 0,2 
têm probabilidade alta de ocorrer. 


O fato de um estimador ser não polarizado simplesmente indica que, 
se muitas estimativas fossem feitas, a média delas coincidiria com o valor 
correto de 0. Entretanto, esta informação nada diz sobre quão espalhados 
em torno de 6 estão as diversas realizações de Ô. A dispersão de uma 
determinada variável aleatória em torno de sua média é quantificada pela 
sua variância, conforme pode ser constatado na Eq.6.29. Apesar de não 


| 
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poder garantir que uma determinada estimativa, ô, esteja perto de 0, se a 
dispersão de tal variável for pequena, a probabilidade de Ô = O será grande. 
Mesmo assim, a probabilidade de estimar um valor distante de O não será 
nula, 

A discussão acima serve como justificativa para o fato de normalmente 
serem preferíveis estimadores que sejam não polarizados e de variância mí- 
nima. À seguir será deduzida a expressão para a variância de um estimador 
do tipo O = Ay. 

Dado o sistema y(k) = 47 (k — 1)8 + e(k), o vetor de parâmetros pode 
ser obtido por um estimador do tipo ô = Ay. Se o estimador for não 
polarizado, a sua matriz de covariância será 


covjô] = E [(ô - efónrô - EL] 
= El(Ay — 0)XAy — 0)7] 
= B[Ayy"A” — Ay0" - Oy" A” + 007) 
= E[A(VO +e)(VO +e)TAT — A(VO + e)” 
-0(VO +e)TA” +007] 
= EI(AVO + Ae)(AVO + Ae)” — (ATO + Ae)o” 
-O(AVO + Ae)” + 007). (6.34) 


Mas como AY = I (ver Consideração 6.1), a equação (6.34) pode ser rees- 
crita da seguinte forma: 


cov[ô] = El(9 + Ae)(9 + Ae)” — (9 + Ae)” 
—0(0 + Ae)” + 007]. (6.35) 


Multiplicando-se os termos, após cancelamentos, chega-se finalmente à ex- 
pressão da covariância do vetor estimado, que é 
cov[ô] = E[Aee" A”). (6.36) 


Deve ser ressaltado que no desenvolvimento acima foi usada a igualdade 
0= E(8), ou seja, foi suposto que o estimador não é  polarizado. Portanto, a 
expressão (6.36) é válida para estimadores do tipo À = Ay não polarizados. 


Exemplo 6.4.1. Variância de estimadores do tipo Ô = Ay 


O presente exemplo procura responder à seguinte pergunta: qual é a 
variância de um estimador do tipo 8 = Ay no caso em que o erro de 
regressão é ruído branco? 
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Para obter a resposta, deve-se começar notando que se e for ruído bran- 
co, a matriz de covariância pode ser expressa como: cov[e] = E[ee”] = o2I 
(ver Exercício 6.11). Portanto, a variância é 


cov[0] = E[AAT)o2, (6.37) 


sendo que o? é a variância do ruído. Para o estimador de mínimos quadra- 
dos, sabe-se que A = [(WTW]-HYT e, portanto, a última equação torna-se 


cov[ôsg] = E [(WTW)-"] o2. (6.38) 


[8] 


Uma estimativa prática de cov(ôua] pode ser obtida substituindo af no 
lugar de 02. Tal aproximação é boa se o estimador não for polarizado e se 
o ruído for branco (ver Exercício 7.11). 

Uma observação importante a ser feita é que, quando o vetor de erros 
e for branco, a variância do estimador de mínimos quadrados será a menor 
de todos os estimadores do tipo ô = Ay que sejam não polanizados. Ou 
seja, cov[ômq) < cov[ô], sendo que as matrizes de covariância são dadas 
pelas Eqs.6.38 e 6.37, respectivamente. Esta afirmação pode ser provada 
verificando-se que a matriz o? (AAT — [WTW]-!) é semidefinida positiva. 
Uma prova um pouco mais detalhada deste fato € apresentada no Comple- 
mento 6.2. 


6.5 Eficiência de Estimadores 


Uma forma de avaliar o desempenho de um determinado estimador é 
compará-lo a um padrão. Mais precisamente, seria interessante comparar 
a variância do estimador a um valor de variância “ótimo”. Se cov[ô) estiver 
próximo de tal padrão, então não seria justificável procurar um estimador 
de menor variância. O padrão comumente usado para estimadores não po- 
larizados é a norma de Cramér-Rao a ser apresentada na próxima seção. 
Além disso, a eficiência de um estimador é definida como 


Fo 
SS 141] 6.39 
f corfõ] (6.39) 

sendo Ef a eficiência do estimador de 6 e F-!, a norma de Cramér-Rao. 

. Para efeito de discussão, um estimador qualquer será representado por 
8 = E(y,u). Note que o estimador E() não deve ser confundido com o ope- 
rador de esperança matemática. Portanto, estimadores lineares podem ser 
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representados da seguinte forma conhecida Ô = Ay, sendo que A normal- 
mente depende dos vetores de dados de entrada e saída u e y, de dimensão 
N. Assim, um estimador não polarizado ô= Ely,u) é mais eficiente do 
que um outro estimador Ô = E(y,u) se cov[ô] < cov(ô), para todo valor de 
N. Além disso, diz-se que um estimador é eficiente se sua variância atinge 
a norma de Cramér-Rao, que é o mínimo atingível por todos os estimadores 
(lincares e não-lincares) não polarizados. A definição formal dessa norma é 
dada a seguir. 


6.5.1 A Norma de Cramér-Rao 


A norma de Cramér-Rao de um estimador de 0 é F-!, em que F, a matriz 
de informação de Fisher, € definida como 


Ego [(dginvutoo) (dginríviO)) | 


- (zo ento IE (6.40) 


F 


sendo p(y | 0) a função de densidade de probabilidade das medições 1 dado 
o vetor de parâmetros 0. Não é o objetivo aqui fornecer uma interpretação 
detalhada de &, mas pode-se notar que tal matriz quantifica como variações 
de 8 afetam p(y | 0). 

É possível provar que para estimadores não polarizados 


cov[ô(y)] > F”!, (6.41) 


sendo que o argumento no vetor estimado simplesmente evidencia que 8) 
é estimado a partir de medições y(k). 


Exemplo 6.5.1. Eficiência de um estimador não polarizado 3 


Deseja-se estimar o parâmetro a da função de densidade de probabilidade 
p(y | 0) = (1/a)expl-y/a], y > 0, a partir de N medições independentes 
de y. Primeiramente, será determinada a norma mínima de Cramér-Rao de 
um estimador não polarizado qualquer do parâmetro a. Em segundo lugar, 
será determinada a variância do estimador em questão, à = A y(k)/N, 
e, finalmente, será verificado se ela atinge ou não a norma de Cramér-Rao. 

A função densidade de probabilidade conjunta das medições y(k) para 
k=1,...,Nêé 


“Norton, 1986. p. 115. 
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N 
pl UN) a) = TT píu(k) 10) 


k=1 


N |. 
= qNexp | >» a) (6.42) 
k=1 


tendo sido a regra de Bayes * utilizada. As seguintes entidades podem agora 
ser determinadas: 


N 
Inp(y la) = -Nino — 3" y(k)/a 
r 
daelula) = —N/a+ 3 u(b)/o? 
k=1 
a N 
solnplula) = jo? = 8 Data) jod (6.43) 


Substituindo-se esses valores na Eq. 6.40, tem-se 


F 


-E Eu E) > v(k) (e 
Rei 


-N/2 + 2 Eli vb ve, (6.44) | 
| 


mas como Ely(k)] = a, então E[DN. y(k)] = Na. Voltando à Eq. 6.44, 
tem-se 


[e] 
| 


-Njo? + pBlNal 
o 
N/e?, (6.45) 


| 

| 

“Seja a função densidade de probabilidade (FDP) posterior, p(O | Y), sendo que Y é | 
o conjunto de todas as possíveis realizações da medição y, e seja a FDP anterior | 

p(9). A Regra de Dayes estabelece que | 


p(01Y) = (Y | 0)p(0)/p(r). 
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Logo, F=! = a2/N é a norma mínima de Cramér-Rao para este exemplo. 
Portanto, var[à] > a2/N, Resta agora determinar a variância do estimador: 


Bla = 87) 
e [BUM pa BU 4 aê 


) 


var[á] 


cn. (6.46) 


Portanto, o estimador deste exemplo é eficiente, pois ele atinge a norma 
mínima de Cramér-Rao (ver Exercício 6.12). [n| 


Na prática, o uso da norma mínima de Cramér-Rao é limitado porque 
raramente se conhece a função densidade de probabilidade das medições. 
Entretanto, usando-se tal norma é possível verificar sob que circunstâncias 
um determinado estimador é eficiente. O Complemento 6.3 mostra que, 
para certas condições, o estimador MQ é eficiente. 


6.6 Complementos 


Complemento 6.1. Polarização do estimador de MQ usando correlação 
— Um ezemplo é 


Seja um sistema representado pelo seguinte modelo ARMAX: 


v(k) + ayy(k — 1) = byu(k — 1) + cav(k — 1) + v(k), (6.47) 


sendo que u(k) e v(k) são seqiências aleatórias de média nula e variâncias o2 
e o2, respectivamente, Os valores das funções de autocorrelação e correlação 
cruzada da saída e entrada para os atrasos O e 1 podem ser determinados 
analiticamente, para N + 00, como (ver Exercício 6,13) 


Lcd = Dao do? + biad 
rolo) = tel fum jatos (cas) 
rml=1) = (ci— 1 = ac - atei)o? + arbto? 
1-aí 
Tyu(O) = 0 
Tyu(=1) = boi, 


“van DEN BOSCH; VAN DER KLAUW, 1994, p, 99, 
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Usando-se à seguinte equação de regressão: 


v(R) + any — 1) = byu(k — 1) + e(k), (6.49) 


é facil mostrar (ver Exercício 6.14) que a equação normal pode ser expressa 
em termos das funções de autocorrelação e correlação cruzada da saída e 
entrada da seguinte forma (note que ruy(1) = ryu(—1)): 


[xe] [26 Soh). es 


sendo que o que premultiplica o vetor de parâmetros é a matriz de cova- 
riância Ru. A solução de (6.50) é (usando-se os valores analiticamente 


calculados para as funções de correlação) 

di cjoz(1 — a?) 
NES. 201c1)02 + bto2 
di. 


Ca 
u 


O resultado acima tem diversos aspectos interessantes, dentre os quais 
ressaltam-se os seguintes: 


a) à estará normalmente polarizado; 


b) by nunca estará polarizado. Portanto, é possível que em um mesmo 
vetor de parâmetros somente alguns deles revelem a polarização do 
estimador; 


c) para evitar polarização na estimativa de a, usando-se o modelo de 
regressão (6,49) e o estimador MQ, é necessário garantir o2 = 0, o 
que equivale a eliminar o erro em (6,47), ou fazer o, = 0. À última 
condição é equivalente a garantir que o erro na equação de regressão 
seja branco. 


Complemento 6,2, Variância mínima do estimador MQ 


Neste complemento será mostrado que o estimador de mínimos qua- 
drados tem a menor variância dentre todos os estimadores lineares não 
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polarizados quando o vetor de erro de regressão é ruído branco. Como in- 
dicado na Seção 6.4.1, isso corresponde a provar que oê (AAT — [WTW]-1) 
é semidefinida positiva. 

A fim de provar esta propriedade, deve ser notado que a matriz esperada 
do produto de uma matriz real pela sua transposta é semidefinida positiva, 
ou seja, E(X X”] é semidefinida positiva se X for uma matriz real (ver 
Propriedade 4.2.2). Se X = A — [TW]-1WT, tem-se 


XX” 


] 


(A — [WTWJWT) (A — [WTW] yr)” 
AMT = Av(UTW]! — (WTW]-IyTAT 4 [pr]! (6.51) 


Escolhendo A = [CW]-!C' (note que esta escolha satisfaz a condição 
AY = 1), tem-se 


AvpWTW! = (CwIcw[yTy]! 
= urlc-iow[yTy]! 
= [UTWj!, (6.52) 


sendo que a propriedade [XY]-! = Y-1X-1 foi utilizada. Analogamente, 
é possível verificar que 


[ETWj-hyTAT = [uTyj-, (6.53) 
Portanto, substituindo-se (6.52) e (6.53) em (6.51), tem-se 


XXT = AA” = [yTyj, (6.54) 


Por fim, aplicando-se a esperança matemática à última equação, obtém-se 


E(XX"] 


H 


E(4AT - EI(U"W)-!] 


ai — Sia (6.55) 
e Je 

sendo que a matriz do lado esquerdo da igualdade é semidefinida positiva 
por construção. Portanto, a variância do estimador de mínimos quadrados 
é a menor dentre todos os estimadores lineares não polarizados no caso do 
vetor de erro ser ruído branco. 
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Complemento 6.3. Eficiência do estimador MQ * 


Considere a saída y(k) de um processo parametrizado da seguinte forma 
v(k) = "0 + e(k), sendo que o erro e(k) é normalmente distribuído com 
média zero e desvio padrão igual a ge. Além disso, a função de densidade 
de probabilidade das medições é dada por 


exp [-0,5(y — V9)"(o21n)-!(y — W0)] 


p(y | 9) = ——— (omNAdefoindo (6.56) 


sendo que N é o número de observações e Iy é a matriz identidade de dimen- 
são N. Agora será determinada a norma de Cramér-Rao de um estimador 
não polarizado de 8. Utilizando (6.56), tem-se 


2-2 (y — VO)T(y — W0) 


Inp(y | 0) In(2m)-M 4 In(oé 


202 
= 28 Nom (y— VO)"(y — WO) 
of In(2m) 3 In(og) E ga (6.57) 


sendo que foi usado det[k A] = k"det[A), n = dim[A). Além disso, 


o)! [) ô 
Bay 6) = Ho [y”y — 07WTy — y" WO + 0TUTWO] 
e 
1 
= 52 [-Wºy - W'y+ (UU + U"U)0] 
e 
1 
= sos [-28"(y - v6). (6.58) 
e 
Finalmente, 
2Inp(y|90) 1 
mr 7. pu 


Logo, a desigualdade de Cramér-Rao se torna 
a vry] 
cov[9] > — [e E) =E[(WTW)-!] o2, (6.59) 


“SópersTRÓM; STOICA, 1989. p. 562. | 
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que é precisamente a covariância do estimador de mínimos quadrados (ver 
Eq. 6.38). Logo, o estimador MQ atinge a norma mínima de Cramér-Rao e, 
portanto, é eficiente, Este resultado mostra que o estimador MQ apresenta 
a menor covariância dentre todos os estimadores (lineares e não-lineares) 
não polarizados, quando o erro for gaussiano e a função densidade de pro- 
babilidade das medições for como mostrada na Eq. 6.56. 


Complemento 6.4. Convergência e consistência do estimador MQ 7 


Suponha que os dados observados tenham sido gerados pelo sistema 
v(k) =bT(k — 1)0 + e(k), (6.60) 


sendo e(k) uma sequência de erros qualquer. Usando-se (6.60) como equa- 
ção de regressão, resulta na equação normal W?y = WTW0. Portanto, o 
estimador MQ pode ser expresso como (ver Eq. 5.43) 


dmg = [UTW]WTy. 


Lembrando que a equação (6.60) pode ser usada para gerar a equação 
matricial y = Wô + e, e substituindo-se tal equação em (5.43), resulta em 


9uq 


o + [WU IvTe 


LE sl 1 
9+ O Mk — Dyk — ) [5 vt-set) 
k=1 k=1 


H 


u 


N 
0 HR! E SD UE Dea), (6.1) 
k=1 


sendo Ry uma matriz de covariância (ver Eqs. 5.24 e 6.50, que contêm ma- 
trizes análogas). Seria desejável que ômq & 0, o que requer que a segunda 
parcela do lado direito de (6.61) seja pequena. Além disso, também seria 
desejável que ôma > 0, para N > 00. 


A fim de investigar o comportamento de ôma quando N 5 09, é conve- 
niente supor que e(k) e u(k) sejam processos estacionários de maneira que 
matrizes de covariância do tipo (ver Eq. 5.24) 


TLIUNG, 1987. p. 177. 
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N 
Ruu(N7) = o u(k)u(k — 7) > Ruu(7), (6.62) 


convirjam para N — oo. Nesse caso, Ry convergirá em probabilidade para 
Ry, uma vez que é composta de somatórios do tipo (6.62). Semelhantemente, 
a segunda parcela do lado direito de (6.61) convergirá em probabilidade para 
Rye: Portanto, desde que Ry seja não singular, 


ômq = 0 + [Ry]"Rye, N > 00. (6.63) 


Finalmente, para que o estimador seja consistente, deve-se ter ômq >0 
à medida que N — oo. As condições necessárias para isso são: 


a) Ry seja não singular. Para isso u(k) e e(k) devem ser independentes 
e u(k) deve ser persistentemente excitante de ordem suficientemente 
elevada, conforme discutido na Seção 4.5; 


b) e(k) é ruído branco. Neste caso Rye = 0, pois e(k) não dependerá 
do que tiver acontecido até o instante k — 1 (note que o vetor de 
regressores, )(k — 1) em (6.60), só tem informação até o instante 
k-1);ou 


c) u(k) e e(k) sejam independentes e não haja regressores da saída em 
W(k — 1), ou seja, ny = O em (2.40), assim 1(k — 1) é independente 
de e(k). 


É interessante notar que algumas das condições listadas acima 
assemelham-se às requeridas para garantir que o estimador MQ não seja 
polarizado. Isso não deve causar surpresa uma vez que a segunda parcela 
do lado direito da Eq. 6.63 pode ser interpretada como um termo de viés ou 
polarização. 


Complemento 6.5. Propriedades estatísticas do estimador MQR 


Neste complemento deseja-se analisar algumas propriedades estatísticas | 

do estimador MQ com restrições descrito no Complemento 5.3. | 
Na análise que se segue é importante observar que existem duas questões 

distintas envolvidas no estimador MQR. Por um lado, há os parâmetros, que | 

nos problemas de interesse serão parâmetros de um modelo dinâmico e, por | 

] 
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outro, está o uso de restrições que garantirão uma determinada caracterís- 
tica estática, que por sua vez depende dos tais parâmetros. 

Para efeito de análise, suponha que a função estática de um modelo seja 
polinomial. Os parâmetros dessa função são os coeficientes de agrupamento, 
que dependem dos parâmetros do modelo. Isso será detalhado no Comple- 
mento 10.5 (ver equação (10.73)), ou mesmo nas Seções 15.2 e 15.3 (ver, 
por exemplo, os itens 3 a 5 do procedimento da Seção 15.2). Uma pergunta 
importante é: os coeficientes de agrupamentos são polarizados? Ou seja, 
será que E[Sômqr — $0] = 0? Usando-se a expressão do estimador (5.58) 
na determinação da esperança matemática, tem-se 


ELS(UTW)-IWTy — Sômq + c — S0] = Ele - 80] =0, (6.64) 


que é verdadeiro por definição, como pode ser constatado de (5.56). Os 
elementos de c são os coeficientes do modelo da função estática f. Aqui, 
por simplicidade, assume-se que tais coeficientes são determinísticos, ainda 
que na prática a própria função f seja frequentemente estimada por métodos 
estocásticos. A implicação prática dessa simplificação é que os elementos 
de c são inequivocamente impostos ao modelo, sem considerar quaisquer 
incertezas associadas. Assim, deve ser lembrado que o modelo resultante 
terá, por construção, uma resposta em estado estacionário que pode ser 
parametrizada por c, quer seus elementos estejam corretos, quer não. 

Com relação à variância dos coeficientes de agrupamentos, que são os 
próprios parâmetros do modelo analisado em estado estacionário, pode-se 
escrever 


cov(Sômar] = Scov[ômqrIS” = SEl(ômqr — 0)(Ômqr — 0)"]ST, 


El(Sômar = c)(Sômar = c)”). 


Como o vetor de parâmetros estimados ômar é forçado a satisfazer 
ô mon = e, segue-se que cov[Sômqn] = 0. Esse resultado indica, como es- 
perado, que (5.58) garantirá que o modelo final sempre terá exatamente a 
função f imposta. Deve ser notado que, se por um lado ômar é um vetor 
de variáveis aleatórias, por outro, Sders é determinístico e igual a c, por 
construção. Na prática de identificação caixa cinza (ver Seção 15,3) esse 
fato implica que, se por um lado o uso de MQR garante que o modelo esti- 
mado sempre terá exatamente um comportamento em estado estacionário 
descrito por f — pois Sôman é determinístico —, por outro, o vetor de 
parâmetros estimados ainda tem muitos graus de liberdade — ômqr é um 
vetor de variáveis aleatórias — o que lhe permitirá melhor se ajustar aos 
dados dinâmicos minimizando o efeito de ruído, 
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Leitura Recomendada 


Praticamente todos os livros textos que descrevem estimadores MQ com 
algum detalhe abordam as características estatísticas de tais estimadores, 
Ljung (1987) trata do assunto deste capítulo em detalhes. O Apêndice II 
desse livro traz uma excelente introdução ao assunto de estimação usando 
mínimos quadrados e análise das propriedades estatísticas desses estimado- 
res. Mendel (1987) também apresenta de forma didática diversos resultados 
sobre propriedades estatísticas de estimadores, com forte ênfase no estima- 
dor MQP. 

Ao contrário do que ocorre para as propriedades estatísticas de estima- 
dores, poucos livros mencionam o problema de erros nas variáveis. Ljung 
(1987) faz menção ao problema apenas de passagem, sendo que Norton 
(1986) comenta as principais dificuldades de maneira introdutória e em 
(SODERSTRÓM; STOICA, 1989) são apresentados alguns resultados teóri- 
cos. Um tratamento mais completo sobre esse assunto com resultados de 
exemplos numéricos e uma boa lista de referências podem ser encontrados 
em (SODERSTRÔM, 1981). Uma solução ao problema de erros nas variáveis 
é provida pelo estimador de mínimos quadrados totais, a ser brevemente 
descrito no Complemento 7.1. Esse estimador é descrito em grande detalhe 
no livro por Van Huffel e Vandewalle (1991). Finalmente, Schoukens e co- 
legas (1997) propuseram um método para resolver o problema de erros nas 
variáveis no domínio do tempo, que faz uso do conhecimento a priori das 
matrizes de covariância dos sinais de ruído que contaminam a entrada e a 
saída. 


Exercícios 


6,1, A função de autocovariância de um processo estacionário e ergódico, 
z(t), é definida como 


Cal) = El(u(t) - 3)(u(t 7) - 3)). 
Mostre que rzz(7) = Crr(T) + T?. 


6,2, Mostre que a condição E(AW] = 1 é satisfeita pelo método de mínimos 
quadrados, e também pelo método de mínimos quadrados ponderados. 


6.3, Seja o sistema y(k) = f(1),0) + e(k), em que o ruído não tem média 
nula, ou seja, Efe(k)] £ 0. 


a) Mostre que o estimador de mínimos quadrados para este caso resultará 
numa estimativa polarizada. 
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b) Proponha uma forma de eliminar a polarização. (Dica: represente o 
tuído como e(k) = e(X) + v(k) sendo e(k) = Ele) e E[v(k)) = 0.) 


6.4. Suponha que o vetor de regressores de um modelo linear seja o seguinte: 
W(k=1) = [y(k=1) ... y(k—ny)]”. Interprete E[We] em termos da função 
de correlação cruzada rye(7) para 7 = 1,... My Sob que condições essa 
estimativa aproxima-se da função de correlação? 


6.5. Determine as condições para que a predição j, de um dado modelo 
v = f(y,u,9) + e, para o qual É = y — 9, seja não polarizada. 


6.6. No Exemplo 6.3.5 foi mostrado como o estimador MQ é polarizado 
quando o ruído que corrompe a saída é um processo AR. Siga passos aná- 
logos aos do exemplo para investigar o problema da polarização quando o 
ruído for um processo MA. 


6.7. Mostre que se não houver ruído de medição na saída, mas houver ruído 
de medição na entrada, o estimador MQ será polarizado. Mostre que se não 
houver ruído de medição nem na entrada, nem na saída, mas se houver 
ruído de atuador (ver Figura 6.5), o estimador MQ não será polarizado. 


6.8. Derive a expressão para a matriz de covariância de um vetor x. Para 
que casos tal matriz iguala a matriz de valor quadrático médio? 


6.9. Expresse cov[Cô] em termos de cov[ô), onde C é uma matriz constante 
e determinística. 


6.10. Discuta qualitativamente (sugestão: use uma figura) uma situação 
em que seria preferível utilizar um estimador polarizado, mas com pequena 
variância, a um estimador não polarizado de variância maior. 


6.11. Mostre que se e for ruído branco com média zero e variância o2, a 
sua matriz de covariância será cov[e] = o2l. 


6.12. Mostre que 


(SÊ E pa Bit 1 cú q 
E dani = 2 Nº (6.05) 


sendo que à = 52X | z,/N é um estimador não polarizado de a. 


6.13. Beato u(k) e v(k) segiências aleatórias de média nula e variâncias 

ot e o2, respectivamente. Suponha que o modelo (6,47) é utilizado para 
sa rar valores de y(k), Mostre que o valor da autocorrelação do sinal de 
saída para o atraso nulo (ou seja, o valor médio quadrático de y(k)) é dado 
pela Eq.6.48. (Dica: lembre-se que ryy(0) = Ely(k)y(h))). 


6,14, Mostre que a equação normal associada ao modelo (6,49) pode ser 
expressa como em (6.50). 


Digitalizado com CamScanner 


Capítulo 7 


Estimadores Não Polarizados 


7.1 Introdução 


No capítulo anterior foi visto que, em certas situações, O estimador de mí- 
nimos quadrados é polarizado, ou tendencioso, Uma das situações em que 
isso ocorre é quando o ruído ou erro na equação de regressão não for branco, 
ou seja, quando o ruído for autocorrelacionado (colorido) e o modelo inclui 
regressores da saída. 

Neste capítulo serão apresentados três estimadores que contornam o pro- 
blema de polarização na situação descrita acima: o estimador estendido de 
mínimos quadrados (EMQ), o estimador generalizado de mínimos quadra- 
dos (GMQ) e o estimador das variáveis instrumentais (VI). Tais algoritmos 
serão denominados estimadores não polarizados ou não tendenciosos. 

Antes de descrever o primeiro estimador não polarizado, considere-se o 
seguinte: seja um sistema e um modelo paramétrico que será usado como 
equação de regressão y(k) = wp”(k — 1)9 + e(k). Esse modelo, juntamente 
com uma massa de dados, gera um conjunto de N equações representado 
por y = Yô9+e. Nessa equação, e é o vetor de erros da equação de regressão. 
Freqiientemente e será chamado de ruído, mas não deve ser confundido com 
o caso de ruído de medição ou observação. O vetor de parâmetros 8 pode 
ser estimado, por exemplo, por estimadores do tipo d=Ay. 

Como visto no capítulo anterior, há basicamente três condições a serem 
satisfeitas para evitar polarização: i) AY = I (Consideração 6.1), ii) Ae e 
serem estatisticamente independentes (Consideração 6.2), ou, pelo menos, 
eles devem ser não correlacionados, conforme a Eq. 6.11 e iii) a média de e 
deve ser nula (Consideração 6.3). Mesmo quando a primeira condição for 
satisfeita é possível que a segunda (e provavelmente a terceira) condição não 
o seja se e for autocorrelacionado, ou seja, se e for colorido. Consegiiente- 
mente, uma forma de evitar a polarização é transformar a equação matricial 
y = VY0+eem 
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y* =W'g' +e', (7.1) 


sendo e* branco de forma que E[A*e*] = 0 e A*W* = I. Os métodos des- 
critos nas Seções 7.2 e 7.3 usam transformações diferentes para resolver o 
problema de polarização. Algumas dessas transformações podem ser repre- 
sentadas pela Eq. 7.1. O método das variáveis instrumentais, descrito na 
Seção 7.4, usa um princípio ligeiramente diferente, como será visto. 


7.2 O Estimador Estendido de MQ 


Inicialmente será considerado um exemplo em que ficará evidenciado como 
a autocorrelação de e resulta em polarização quando o método de mínimos 
quadrados é utilizado. Esse exemplo mostrará que uma possível solução 
será estender a matriz de regressores, W», de tal forma que ela passe a incluir 
novos regressores, A matriz de regressores estendida será indicada por W*. 
Essa mudança, como será visto, tem um preço: o novo vetor de parâmetros, 
8º, também será estendido e o problema resultante não será linear em 0º, 
uma vez que W* dependerá de 0º. 


Exemplo 7.2.1. Polarização devida a ruído MA — análise 


No Exemplo 6.3.5 foi visto como a presença de erros do tipo AR e de 
regressores da saída resultavam em polarização. Neste exemplo, será visto 
como erros que podem ser modelados como ruído MA e regressores de saída 
também resultam em polarização no estimador MQ. Como será visto, a 
característica que na realidade induz polarização é o fato de o erro que 
aparece na equação de regressão ser autocorrelacionado juntamente com o 
fato de o modelo incluir regressores da saída. Para ver isso, considere o 
modelo ARX: 


v(k) = ay(k — 1) + bu(k — 1) + e(k), (7.2) 
sendo que e(k) é um processo MA da seguinte forma: 
e(k) = cu(k — 1) + v(k), (7.3) 
e v(k) é ruído branco. Substituindo (7.3) em (7.2), tem-se 
u(k) = ay(k — 1) + bu(k — 1) +cu(k = 1) + v(k), (7.4) 
portanto 
Ulk = 1) = ay(k — 2) + bu(k — 2) + cu(k — 2) + v(k — 1). (7.5) 
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Substituindo a Eq. 7,5 em (7.4), chega-se a 


uk) = alay(k = 2) + bu(k — 2) + cu(k = 2) + v(k — 1)] 
+bu(k = 1) + cu(k = 1) + v(h), (7.6) 


que pode ser representado na forma y(k) = 1h” (k — 1)0 + e(k), em que 


VT(k-1) = [(avtt-2) +bu(k-2) + cu(k-2) +u(k-1)) u(k-)] 
[:) fa bj” 
e(k) = cu(k-1)+v(k). (7.7) 


Note como os termos sublinhados são idênticos. Isso revela que, no 
presente caso, os regressores estão correlacionados com o erro e(k). Em 
outras palavras, 4h” (k — 1) e e(k) estão correlacionados, violando assim a 
Consideração 6.2 (ver p. 252). Se o estimador MQ fosse utilizado neste 
exemplo para estimar o vetor de parâmetros 0, este estaria polarizado. No 
Exemplo 7.2.3 será visto como evitar a polarização em tais casos. [n| 


Exemplo 7.2.2. Polarização devida a ruído MA — simulação 


No presente exemplo os dados serão gerados pelo seguinte modelo: 
vlk) = ay(k — 1) + bu(k — 1) + ek), (7.8) 


sendo que o erro e(k) = O,8v(k — 1) + v(k) é um processo MA e v(k) é 
ruído branco, de distribuição gaussiana, média nula e variância o2 = 0,04. 
O sinal de entrada u(k) também foi escolhido como ruído branco, gaussiano 
de média nula e o2 = 1, independente de v(k). 

Usando-se (7.8) como equação de regressão e o estimador MQ para obter 
à e b em 400 realizações diferentes do ruído v(k), chegou-se aos resultados 
mostrados na Figura 7.1. Conforme visto no Exemplo 7.2.1, o estimador 
MQ é polarizado para o caso do parâmetro a, sendo que os resultados das 
simulações confirmam tal expectativa, 

Mais uma vez, vale a pena notar que o parâmetro correspondente ao 
regressor u(k — 1) foi estimado sem polarização, Isso confirma os resultados 
do capítulo anterior, onde foi visto que o estimador MQ não é polarizado, 
mesmo na presença de erros do tipo ruído colorido, se os dados puderem 
ser modelados com regressores de entrada apenas, ou seja, usando-se um 
modelo de resposta ao impulso finita (FIR). D 
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(n) 


on OM O OM om OM OM O 


(b) 


da am cu oo os om ou os au aM 


Figura 7.1: Polarização em modelos ARX com ruído colorido 


Polarização em modelos ARX devida ao acréscimo de ruído colo- 
rido do tipo MA (e(k) = 0,8v(k — 1) + v(k)) e presença de regres- 
sores de saída. Os valores reais dos parâmetros são (a) a = 0,7 e 
(b) b= 0,5 (bias31 O), 


O Exemplo 7.2.1 é muito semelhante ao Exemplo 6.3.5, em que a po- 
larização foi induzida por erros do tipo ruído AR, Na realidade, a causa 
da polarização em ambos os casos é a mesma, a saber a autocorrelação do 
vetor de erros de regressão, ou seja, ree(k) É O para valores de k pequenos 
e diferentes de zero, 

Os exemplos acima deixaram claro que a polarização no estimador de mi- 
nimos quadrados surge como consegiiência da correlação existente no vetor 
de erros e da presença de regressores da saída. Isso acaba correlacionando 
a matriz de regressores com e(k). É interessante notar que se o modelo em 
questão só tiver regressores da entrada, ou seja, termos do tipo u(k — i), o 
fato de se ter ree(k) % O para algum k £ O não resulta em polarização do | 
estimador MQ (ver Exercício 7.1). | 
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Estas considerações sugerem como solução para o problema de polariza- 
ção incluir a parte correlacionada do vetor de erro na matriz de regressores 
de forma a garantir que aquilo que fica de fora de tal matriz não é correla- 
cionado com os regressores. A solução, portanto, para o problema descrito 
no Exemplo 7.2.1 é discutida a seguir. 


Exemplo 7.2.3. Eliminando polarização com o estimador EMQ — análise 


A equação matricial gerada por (7.6) pode ser reescrita da seguinte 
forma: 


v(k) lu(k=1)) u(k-1)  uk=1) 
vk+) || tubo) u(k) v(k) Ê 
: 7) : i : E 
v(k+N-1) (AND) u(6A+N=2) v(k+N=2)] 6º 
v(k) 
ns 1) (19) 
UkA+N-1) 
y* = V'O'+e', 


sendo que y* =y,e* =[v(k) ... v(k+N-DJ, 


v(k —1) 
v(k) 
P=) mo ih) 


: U(kAN-2) 


e 6º =([67 : c]”. Em geral, se o modelo a ser estimado possuir np termos 
de processo e ne termos de ruído! então W* E IRNX(Np+ne) e 9º E RNpt+ne, 

Deve ser notado que e*(k) é uma variável aleatória “branca”, de forma 
que, na Eq. 7.9, e* não está correlacionado com 'Y*. Ou seja, 


!Em um modelo do tipo y(k) = termos de processo+ciE(k-1)+"--+cn.Elk-ne)+E(K), 
o valor £(k) não é considerado um termo do modelo de ruído, que neste exemplo tem 
ne termos. Termos de processo são aqueles que envolvem regressores da saída y(k) 
ou da entrada u(k), ou seja, os termos de processo são a parte ARX do modelo. 
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Tetes(k) =0, VR £0, 


e consegiientemente E[Ve*] = 0, E[A*e*] = O e E[W*e'] = O. Logo, a 
estimativa 
ô* PS [ueTpeiwtTy (7.10) 


não apresentaria polarização, ou seja, E[ô'] = [87 c]", se pudesse ser deter- 
minada. Note que os elementos, da matriz W*, entre colchetes na Eq. 7.9 
correspondem aos termos entre colchetes na Eq. 7.6. [nm] 


A solução não polarizada foi obtida aplicando-se o estimador de míni- 
mos quadrados, estudado no Capítulo 5, à equação matricial transformada 
(7.9), resultando assim em (7.10). Obviamente, (7.10) não pode ser usada 
como solução em um problema real pelo fato de que nem todos os elemen- 
tos de 'Y* são medidos. Supondo-se que todos os elementos de W* fossem 
conhecidos (alguns medidos e outros estimados), o algoritmo descrito acima 
nada mais seria do que o estimador MQ aplicado a uma matriz de regres- 
sores estendida. Tal matriz inclui não apenas regressores de processo, mas 
também regressores de ruído. O estimador estendido de mínimos quadra- 
dos, portanto, é um algoritmo que além de resolver (7.10) deverá estimar 
os novos regressores da matriz W*, regressores esses que não são medidos. 

Outro aspecto importante a observar é que o estimador EMQ tanto 
estima o modelo do processo como o modelo do ruído (note que O inclui 
o parâmetro é). Obviamente, se o modelo do ruído na Eq.7.3 tivesse ne 
parâmetros, todos eles deveriam ser estimados. Esse fato aponta para uma 
dificuldade de ordem prática: como determinar a estrutura do modelo do 
ruído (7.3)? Se o único objetivo ao se estimar o modelo de ruído é minimizar 
os efeitos de polarização, então, a ordem do modelo (7.3) não é crítica e pode 
ser escolhida o suficientemente complexa para garantir que os resíduos sejam 
brancos (ver Exemplo 7.2.5). Por outro lado, se o modelo do ruído também 
for importante (por exemplo, para determinar o espectro de potência do 
ruído), o mesmo deverá ser escolhido seguindo algum critério. 


Exemplo 7.2.4. Resíduos como estimativa do ruído 


O objetivo deste exemplo é mostrar que é possível utilizar os resíduos 
como estimativas de v(k), a fim de montar a matriz estendida W*. 

Usando-se (7.8) como equação de regressão (à semelhança do que foi 
feito no Exemplo 7.2.2), obtém-se um modelo do tipo 


v(k) = ày(k — 1) + Du(k — 1) + E(R), (7.11) 
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sendo que à e d para 400 realizações diferentes dos dados (N = 500) estão 
mostradas na Figura 7.1, e claramente se percebe que o estimador MQ 
produziu resultados polarizados, 


atrasos 


FIGURA 7.2: FACs de ruído e resíduos 


Funções de autocorrelação de: (o) ruído MA e (+) resíduos E(k). 
No gráfico superior os resíduos são do modelo (7.11). O valor 
de £(1), fora da faixa de confiança, indica que os parâmetros do 
respectivo modelo estão polarizados. No gráfico inferior cruzes 
indicam a FAO do vetor de erro estimado usando os resíduos de um 
modelo não polarizado, ou seja, ê(k) = 8, E(k—1) +ê,E(k—2) +E(k) 
e o traço contínuo indica e(k) (bias81 O), 


A função de autocorrelação de E(k) e a do erro e(k) estão mostradas 
na Figura 7.29. Essa figura revela pelo menos duas coisas, Em primeiro 
lugar, o valor de €(1), fora da faixa de confiança, indica que os parâme- 
tros do respectivo modelo estão polarizados, conforme será discutido em 
detalhes no Capítulo 13, Em segundo lugar, devido à polarização, res(7) 
não é uma aproximação muito boa de ree(T), ou seja, à variável aleatória 
€(k) não tem propriedades estatísticas muito próximas às de e(k). De ma- 
neira geométrica, essa diferença pode ser interpretada lembrando que é é 
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"3 
FA 
[74 


ortogonal à hipersuperfície gerada pelas colunas de WW, pois tais resíduos 
correspondem a um modelo enjos parâmetros foram obtidos pelo estimador 
MO. Por outro ladoçe não é ortogonal a tal superfície, pois uma parte de 
e pode ser explicada por um dos regressores do modelo (ou seja, e tem 
prodeção mão mula sobre a hipersuperfície gerada pelas colunas de '). 

4 Pigura 7:2b compara as PAC do erro efetivamente adicionado à equia- 
ção de regressão e(k) e o erro estimado usando-se os resíduos de um modelo 
não polarizado, É(A). Para isso foram utilizados parâmetros estimados pe- 
lo próprio estimador EMQ, conforme será discutido no Exemplo 7.2.5. A 
Figura 7.2b mostra que estatisticamente 


CR) = 08Sv(k = 1) +v(h) = GE - 1) + EK = 2) +E(h). (7.12) 


mindo-se que a parte modelável do vetor de erro foi devidamente mo- 
lada (isso será constatado verificando-se que a polarização é eliminada, 
conforme será discutido no Exemplo 7.2.5), ou seja, se for verificado que 
OSv(k — 1) = GÊ(k — 1) + GrÊ(k — 2), então É(k) = v(k). Portanto, este 
exemplo verificou que, após a convergência, os resíduos podem ser utiliza- 
dos como estimativa da nova variável regressora v(k) que aparece em W*. 
É precisamente isso que é feito pelo estimador EMQ. [a 


Em vista dos resultados do Exemplo 7.2.4, uma solução é utilizar os 
resíduos do modelo como estimativas de v(k). Mas, para calcular v(k), é 
necessário conhecer o modelo, portanto, a solução completa requer o seguin- 
te procedimento iterativo: 


1. a partir da equação de regressão y(k) = bT(k — 1) +e(k) e dos dados 
disponíveis, monte a equação matricial y = YO +e, como no método 
de mínimos quadrados, e determine Ômq = [VTW]-hWTy; 

2. calcule o vetor de resíduos € = y — YÔmg; 

3. faça à =2 (i indica o número da iteração); 

4 com 6i-1, monte a matriz estendida de regressores, W$, e estime 

Orgs = [W;T WA] Ir y; 
. determine o vetor de resíduos €, = y — Viôpmqii 
6. faça di = + 1 e volte ao passo 4. Repita até convergir. 


e 


Para verificar a convergência, pode-se monitorar a variância dos resi- 
duos, of, ou o vetor de parâmetros ôemgs: Na prática, 3 <i < 10 é 
normalmente suficiente para atingir a convergência. Deve ser notado que 
o primeiro passo do algoritmo acima pressupõe que a estrutura do modelo 


| 
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tenha sido escolhida a priori. O mesmo vale para a estrutura do modelo do 
ruído, necessária no passo 4 para montar a matriz estendida. 

Deve estar claro que o estimador EMQ assume que o modelo é do tipo 
ARMAX. Os regressores de ruído desse tipo de modelo (a parte MA) não são 
medidos e, portanto, precisam ser estimados. Para isso pode-se determinar 
(ver Eq. 7.4) 


v(k) vu(k) — ay(k — 1) — bu(k — 1) — cu(k — 1) (7.13) 


v(k) sã pk o 1,9*)0º, 


assumindo-se que no instante k — 1 todos os regressores e parâmetros do 
lado direito do sinal de igualdade de (7.13) são conhecidos. O fato de v(k) 
depender dos parâmetros do modelo, implica que o modelo ARMAX, a 
rigor, é não linear nos parâmetros do modelo, pois o vetor estendido de 
regressores 1h*(k — 1,9*) depende dos parâmetros e não apenas de medições 
como nos casos dos modelos ARX e IIR. Portanto, a necessidade de um 
algoritmo iterativo para estimar os parâmetros de modelos ARMAX é uma 
consegiiência de tais modelos não serem lineares nos parâmetros. Modelos 
com esta propriedade são às vezes chamados de modelos pseudolineares. 


Exemplo 7.2.5. Eliminando polarização com o estimador EMQ — simulação 


Os dados do Exemplo 7.2.2 serão usados juntamente com o estimador 
EMQ para estimar os parâmetros a e b do modelo (7.8). 

A fim de estender a matriz de regressores, é necessário decidir que novos 
regressores (agora regressores de ruído) serão usados. O objetivo de incluir 
tais regressores é modelar a parte modelável do erro, que não é branco. Ao 
fazer isso, pode-se tentar garantir que os resíduos sejam brancos e, portanto, 
não correlacionados com a matriz estendida de regressores. 

Com o objetivo de ilustrar como o estimador EMQ evita polarização 
(viés), dois casos diferentes serão simulados. No primeiro caso será esti- 
pulado que o modelo de ruído é do tipo e(k) = cu(k — 1) + v(k), ou seja, 
será usado um modelo de ruído com a mesma estrutura do modelo empre- 
gado para gerar o vetor de erro na equação de regressão do Exemplo 7.2.2. 
Conforme esperado, os parâmetros a e b do modelo (7.8) foram estimados 
sem viés e o parâmetro c também (lembre-se de que o estimador EMQ 
além de estimar os parâmetros do modelo do processo, também estima os 
parâmetros do modelo de ruído). 

No segundo caso, ilustrado na Figura 7,3, foi estipulado que o modelo 
de ruído era do tipo e(k) = c(k — 1) + cov(k — 2) + v(k), para investigar o 
que ocorre se a estrutura do modelo de ruído não for exatamente a mesma 
que a do modelo usado para gerar os dados. 
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(a) (o) 


%a o “q o 1 
Figura 7.3: Eliminando polarização com o estimador EMQ 


Uso do estimador EMQ para evitar polarização devida a erros 
do tipo ruído colorido MA (e(k) = 0,8v(k — 1) + v(k)) e presen- 
ça de regressores de saída. Os valores reais dos parâmetros são: 
(a)a=07;(b)b=0,5;(0)c =c=08e(d)c; =0 (biasat O). 


A Figura 7.3 sugere que o estimador EMQ determinou os parâmetros 
sem polarização. Além disso, “percebendo” que o vetor de erro era um 
processo MA de primeira ordem, o estimador corretamente estimou cp de 
tal forma que E[ô] = 0. [a] 


Exemplo 7.2.6. Estimador EMQ com modelo de erro na saída 


No Exemplo 6.3.4, foi mostrado como o estimador MQ era polarizado 
ao ser usado para estimar os parâmetros de um modelo de erro na saída 
com ruído branco. Como visto naquele exemplo, a razão para isso é que o 
erro na equação de regressão e(k) = F(q)v(k) não é branco, ainda que v(k) 
o seja. Reescrevendo o modelo de erro na saída (2.50) como 


F(a)ylk) = Bla)u(k) + Fla)v(k), 


percebe-se que está representado na forma de um modelo ARMAX com 
A(q) = F(q) e C(a) = F(q). Portanto, deve ser possível utilizar o estimador 
EMQ para estimar, sem polarização, os parâmetros de um modelo de erro 
na saída, 


| 


Digitalizado com CamScanner 


7.2 O EsTIMADOR ESTENDIDO DE MQ 291 


Assim, usando-se o mesmo modelo de erro na saída do Exemplo 6.3.4 
para gerar dados, e usando-se a parametrização 


A(a)y(k) = Bla)u(k) + Clg)v(h), 


obtêm-se os resultados mostrados na Figura 7,4. 

Conforme pode ser constatado, E(Ã(q)] = E[É(q)] = ElF(g)]. Con- 
seqiientemente, o estimador EMQ determinou parâmetros não polarizados. 
Nota-se que a variância dos parâmetros do polinômio C(q) (modelo de ruído) 
é significativamente maior do que para A(q). D 


Es 

1) 0 

195 14 145 15 155 16 135 14 145 15 155 16 
10 10 
35 


045 05 055 
FIGURA 7.4: Estimador EMQ com modelo de erro na saída 


Parâmetros estimados usando-se o estimador EMQ e um modelo 
ARMAX. Os dados foram gerados por um modelo de erro na 
saída. Os valores reais dos parâmetros são: (ab) a =c =1,5; 
(cd) a=0o=-07e(e)b =0,5. 
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7.2.1 O estimador EMQ e o problema de erros nas variáveis 


A Seção 6.3.3 apresentou o problema de erros nas variáveis. A principal 
conclusão daquela seção pode ser resumida da seguinte forma: tanto o ruído 
de observação no sinal de entrada, quanto o ruído de atuador produzem uma 
parcela não branca no erro de regressão. A diferença entre os dois casos é 
que no problema de erros nas variáveis o erro na equação de regressão está 
correlacionado com o sinal de entrada utilizado pelo estimador. Isso não é 
verdade no caso do ruído de atuador, pois nesse caso o erro na equação de 
regressão e o sinal de entrada utilizado pelo estimador são independentes. 

A Seção 7.2 apresentou o estimador EMQ. Como visto, esse estimador 
é capaz de contornar o problema de polarização em casos em que o ruído 
na equação de regressão não for branco. Para alcançar isso, o estimador 
modela o erro na equação de regressão como um ruído MA. Se o erro puder 
ser estatisticamente bem aproximado por um ruído MA e se o erro não 
for correlacionado com o sinal de entrada, então o problema de polarização 
estará resolvido. A idéia é reescrever o modelo na forma 


v(k) =” (k — 1)0 + WE (k — 1)ô, + v(k), (7.14) 


em que a parcela yT(k — 1)ô, + v(k) é o modelo MA do erro na equa- 
ção de regressão. A polarização é evitada pelo fato de o sinal v(k) não 
estar correlacionado com as variáveis regressoras que compõem 1)(k — 1) e 
Wv(k — 1). Entretanto, no problema de erros nas variáveis o erro na equa- 
ção de regressão está correlacionado com as variáveis regressoras de entrada. 
Consegiientemente, basta que (k — 1) contenha algum regressor de entrada 
para que v(k) e tal regressor sejam correlacionados. 

Seguindo o mesmo argumento, percebe-se que o estimador EMQ não é 
polarizado no caso de ruído de atuador, nem tampouco no caso de ruído 
branco na saída (ver Exercício 7.3). 


7.3 O Estimador Generalizado de MQ 


Na seção anterior, foi visto que o estimador estendido de mínimos quadrados 
contorna o problema de polarização estendendo a matriz de regressores de 
forma a incluir a parte explicável do vetor de erro. Desta maneira, a parcela 
que fica fora da matriz estendida de regressores é branca, evitando assim a 
polarização. 

Uma outra maneira de eliminar a polarização é filtrar o vetor de erro 
original de forma que e* = Qe seja branco. Portanto, sendo Q E IRNxN 
uma matriz que satisfaça a restrição acima, tem-se 
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Qy = Q(0 + e) 
Qy = Qro +Qe 
y'=Wo+e. (7.15) 


Seja R = cov[e] a matriz de covariância do ruído da equação de regressão. 
Da definição de e* e da Eq.6.31 têm-se as seguintes relações: cov[e*] = 


cov[Qe] = Qcov[elQ” = QRQT. A matriz Q pode ser obtida a partir 
da decomposição de Choleski (ver Seção B.2), sendo que R é simétrica e 
semidefinida positiva. Como o objetivo de premultiplicar e por Q é tornar o 
produto, e*, um ruído branco, tem-se cov[e*'] = Q RQT = 02.1 e, portanto, 


R=QliQTer!= a (7.16) 


sendo que foi utilizada a propriedade (XY)-! = Y-!X-1. A estimativa de 
mínimos quadrados de O a partir das grandezas filtradas W* e y* é 


] 


(etyejo! W'Tyt 

(QUTQUI] (QU Qy 

[NTQTQU]"! vTQTQy 

[WToZr- ty]! worry 

[wTR-w]! yTRoly. (7.17) 


ôema 


O algoritmo acima é conhecido como o estimador generalizado de míni- 
mos quadrados (GMQ), ou ainda, como o estimador de Markov. A última 
equação evidencia que o estimador GMQ nada mais é do que o estimador 
ponderado de mínimos quadrados (PMQ), quando a matriz de pesos é a 
inversa da matriz de covariância do ruído. 

A discussão acima objetiva mostrar que o estimador GMQ evita a polari- 
zação via filtragem dos sinais envolvidos, isto é, usa-se y* = Qy e V* = QY, 
em vez de y e Y. Como tal filtragem torna o ruído branco, o filtro associado 
será chamado de filtro descorrelacionador. ? 

A Eq. 7.17 não é adequada para implementações práticas por dois moti- 
vos básicos. Primeiramente, N, que é a dimensão da matriz R € IRNXN, é 
normalmente grande. Em segundo lugar, tal matriz não é conhecida a prio- 
ri. No próximo exemplo, a fim de ilustrar o uso de (7.17), os dois problemas 
mencionados acima serão contornados, ainda que de forma pouco realista. 


20 termo em inglês é whitening filter. 
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Exemplo 7.3.1, O estimador de Markov 


Para ilustrar o estimador de Markov (7.17), serão considerados os dados 
gerados no Exemplo 7.2.2, no qual o modelo de ruído empregado foi o mesmo 
do Exemplo 4.2.2. Portanto, será usada a seguinte matriz de covariância do 
erro na equação de regressão 


l+& a 
[o 1+e [o 
a Irã q 
R=o2 aÃ qo e : (7.18) 
q 
aq l+a& 


Tomando-se uma segiência de 100 valores (em vez de 500, como no 
Exemplo 7.2.2), os valores estimados para os dois parâmetros do modelo 
(7.8) durante 400 realizações diferentes são mostrados na Figura 7.5 por 
meio de histogramas. Como os valores mais prováveis são aproximadamente 
os valores nominais dos parâmetros usados para gerar os dados, pode ser 
constatado que o estimador de Markov não é polarizado neste caso. [| 


(a) (b) 


ta a k, 


oO an 


FIGURA 7.5: Estimador de Markov 


Distribuição de parâmetros estimados pelo estimador de Markov, 
assumindo-se que a matriz de covariância do erro na equação de 
regressão é conhecida (c; = 0,8 e o2 = 0,04). Os valores re- 
ais dos parâmetros são os seguintes: (a) a = 0,7 e (b) b = 0,5 


(gnquark O). 


No exemplo acima foi assumido que a matriz de covariância do erro na 
equação de regressão era conhecida. Em realidade, basta conhecer o modelo 
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do ruído para poder determinar a sua matriz de covariância (ver Exem- 
plo 4.2.2). Por outro lado, foi visto no Exemplo 7.2.5 que é possível estimar 
corretamente os coeficientes do modelo de ruído. Portanto, é possível, pelo 
menos em princípio, estimar o modelo do ruído e, subsegientemente, usar 
o estimador de Markov. Na próxima seção será mostrada uma forma de 
obter ôma sem ter que explicitamente determinar a matriz de covariância 
do ruído. O algoritmo apresentado na próxima seção é iterativo e assume 
que o erro na equação de regressão é um processo AR, mas a extensão para 
outros tipos de ruído é simples. 


7.4 O Estimador GMQ Iterativo 


Na Seção 7.3 foi apresentado o método generalizado de mínimos quadrados. 
Em poucas palavras, o estimador GMQ evita a polarização nos casos em 
que a matriz de covariância do ruído, R, não for da forma o2I, ou seja, 
quando o ruído não for branco. A solução proposta pelo estimador GMQ é 
basicamente a de estimar os parâmetros do modelo utilizando o estimador 
ponderado de mínimos quadrados, usando a inversa da matriz de covariância 
do ruído, R-!, como matriz de pesos. À justificativa, bem como os detalhes 
do procedimento podem ser encontrados na Seção 7.3. 

Do ponto de vista prático, o uso da Eq. 7.17 é inadequado. Em primeiro 
lugar, a matriz R não é conhecida e algum tipo de estimativa deveria ser 
utilizada. Em segundo lugar, mesmo para dimensões pequenas, a matriz 
R é normalmente malcondicionada se for determinada diretamente a partir 
dos dados (ver Exercício 7.2). Esse problema se agrava na prática pois 
R E IRNXN, sendo que N é normalmente da ordem de algumas centenas. 
A seguir será visto como um procedimento iterativo pode ser utilizado para 
contornar o problema numérico acima mencionado. 

Para estudar esse problema, o modelo em questão será representado na 
seguinte forma: 

à = BD 1) 4 SD 
y(k) had? A(g) u(k) + D(q) v(k), (7.19) 
sendo que 4, B,C e D são polinômios em q”, conforme definidos em (2.40) 
e v(k) é ruído branco. Omitindo os argumentos em (7.19), tem-se 


AC 
Ay(k) = Bulk) + Soo(h). (1:20) 
Substituindo-se D = AD' na última equação, tem-se 


Av(k) = Bu(k) + Srt, (121) 
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sendo que o erro e(k) = v(k) C/D' não será branco, a menos que C/D' = 1. 
Esse fato, como visto anteriormente, induz polarização nos parâmetros do 
modelo se o estimador MQ for utilizado. Para efeito de argumentação, su- 
ponha que C/D' seja conhecido. Nesse caso seria possível obter os seguintes 
sinais filtrados: 


vo = Dou(h) 


D' 
uk) = u(k). (7.22) 
(o) 
Multiplicando-se os sinais na Eq. 7.21 por D'/C, tem-se: 
4 4 
AGU) = Begu(h) + uh) 
Ay'(k) = Bu'(k) + v(h). (7.23) 


Na equação acima, que se tomada ao longo de uma janela de dados produz 
uma equação do tipo (7.15) (ver Exercício 7.6), pelo fato de v(k) ser branco 
o estimador MQ não apresentará polarização. Assim, o estimador GMQ 
pode ser interpretado como o estimador MQ aplicado a versões filtradas 
dos sinais de entrada e saída. O filtro D'(q)/C(q) tem por objetivo tornar 
o ruído colorido, v(k) C(q)/D'(q), branco. Como visto na seção anterior, 
D'(q)/C(q) é um filtro descorrelacionador de ruído. Na prática, esse filtro 
também precisa ser estimado. Isso pode ser feito iterativamente, conforme 
indicado no procedimento a seguir: 


1. usando o estimador MQ, estime À; e B; com y$.1(k) e uz. 1(k); 
2. determine os resíduos fazendo E;(k) = A;y(k) — Byu(k); 


3. ajuste um modelo auto-regressivo usando o estimador MQ para a 
segiiência de resíduos, ou seja, D';(q) Ei(k) = Ci(g) vi(k). D'i(g)/Ci(a) 
60 filtro descorrelacionador de ruído a ser utilizado na iteração i; 


4. atualize yj (+) = [D'i(9)/Gi(0)] lb) e uz(6) = [D'i(a)/Ci(a)] u(k), que 
são as séries filtradas. Incremente i e volte ao passo 1 até observar 
convergência. 


Na primeira iteração D'(q)/C(q) = 1. Portanto, yo(k) =y(k) e ug(k) =u(k). 
Na prática, iterando-se o procedimento acima de três a cinco vezes, ou seja, 
para i = 3,4,5, é, normalmente, suficiente para atingir a convergência. 
Deve ser notado que os “resíduos” mencionados no passo 2 são os erros de 
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regressão da Eq. 7.20. A rigor, o resíduo propriamente dito resultante do 
processo completo de modelagem é v(k), que aparece no passo 3. 

O algoritmo acima é o estimador GMQ apresentado na Seção 7.3 mas 
resolvido de forma iterativa. Pressupõe-se que todos os dados estão dispo- 
níveis desde a primeira iteração. Ou seja, 0 algoritmo é iterativo, mas não 
recursivo. Devido ao fato de os resíduos E(k) não serem brancos, o modelo 
do filtro é estimado no passo 3. Se E(k) fossem brancos, o passo 3 não seria 
necessário (nem tampouco a iteração pois D'/C' = 1) e o estimador acima 
seria o conhecido estimador MQ. É interessante notar as semelhanças entre 
o presente algoritmo e o estimador EMQ (ver Exercício 7.7). Finalmente, 
deve ser notado que escolhendo-se C = 1 no procedimento acima correspon- 
de a modelar o ruído com um processo AR. Para C £ 1, o ruído é modelado 
como um processo ARMA. 


Exemplo 7.4.1. O estimador GMQ com ruído MA e AR 


O presente exemplo tem por objetivo ilustrar o desempenho do estima- 
dor GMQ para modelos de erro na equação quando os erros são do tipo 
ruído MA e ruído AR. 

Para começar, serão utilizados os dados gerados no Exemplo 7.2.2, em 
que o ruído na equação de regressão é do tipo MA, À semelhança daquele 
exemplo, (7.8) foi usada como equação de regressão. O estimador GMQ foi 
empregado para obter à e b em 400 realizações diferentes do ruído v(k) com 
N = 500, obtendo-se os resultados mostrados na Figura 7.6, onde se observa 
que o estimador GMQ foi bastante eficaz em reduzir o efeito da polarização, 
como pode ser confirmado comparando-se as Figuras 7.6a e 7.6b. Essa foi a 
consegiiência de modelar o vetor de erro na equação de regressão como um 
processo AR, como visto no procedimento detalhado acima. 

Apesar de ter reduzido sensivelmente a polarização, o algoritmo não foi 
capaz de estimar o coeficiente do modelo do ruído (ver Figura 7.7) pelo 
fato de partir da premissa de que o vetor de erro era ruído AR, quando 
na realidade era MA. Note, como no Exemplo 7.2.5, em que foi usado o 
estimador EMQ (que pressupõe ruído MA), o coeficiente do modelo do 
ruído foi corretamente estimado. A mesma dificuldade ocorre quando o 
erro na equação de regressão é do tipo AR e se usa o estimador EMQ, que 
pressupõe que o erro é MA. 

Na segunda parte do exemplo, repetiu-se o procedimento anterior, mas 
desta vez empregou-se um vetor de erro do tipo ruído AR na equação de 
regressão (7.8). O modelo de ruído usado foi e(k) = 0,8e(k — 1) + v(k). 
Os resultados estão mostrados nas Figuras 7.8 e 7.9. Conforme pode ser 
observado, o coeficiente do modelo do ruído foi estimado razoavelmente 
bem, 
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FIGURA 7.6: Estimador GMQ com ruído MA 


Histogramas dos parâmetros estimados pelo estimador GMQ, pa- 
ra o caso de erros do tipo ruído MA (e(k) = 0,8/(k — 1) + v(k)) e 
presença de regressores de saída. Os gráficos (a) e (c) correspon- 
dem aos valores dos parâmetros estimados na primeira iteração 
do algoritmo iterativo, ou seja, correspondem ao estimador MQ. 
Os gráficos (b) e (d) mostram os valores estimados após 4 ite- 
rações do estimador GMQ. Os valores reais dos parâmetros são 
(ab) a = 0,7 e (cd) b= 0,5 (gmqmark O). 
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FIGURA 7.7: Estimador GMQ com ruído MA, coeficiente de ruído 


Histograma de estimativas de di; sendo D'(q) =1+d qr. A 
razão de El-dilf 0,8 deve-se no fato de que o estimador GMQ 
pressupõe ruído AR e, na realidade, o ruído usado para gerar os 
dados foi do tipo MA (gmqmark O). 
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FIGURA 7.8: Estimador GMQ com ruído AR 


Histogramas dos parâmetros estimados pelo estimador GMQ, para 
o caso de o erro ser do tipo ruído AR (e(k) = 0,8e(k — 1) + 
v(k)) e presença de regressores de saída. Os gráficos (a) e (c) 
correspondem aos valores dos parâmetros estimados na primeira 
iteração do algoritmo iterativo, ou seja, corresponde ao estimador 
MQ. Os gráficos (b) e (d) mostram os valores estimados ao fim de 
4 iterações do estimador GMQ. Os valores reais dos parâmetros 
são (a,b) a = 0,7 e (c,d) b= 0,5 (gmqmark O). 


Lund em o eu Li, 


FiGuRrA 7.9: Estimador GMQ com ruído AR, coeficiente de ruído 


Histograma de estimativas de -dy sendo D'(q) =1+ dig. (0) 
valor real de dy é 0,8 (gmqmark O), 


Quando o ruído era MA obteve-se E[ê) x 0,5, ao passo que quando o 
ruído usado foi do tipo AR estimou-se E[ê] = 0,8. Isso parece sugerir que 
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o modelo de ruído AR e(k) = 0,5e(k — 1) + v(k) é uma aproximação do 
modelo de ruído MA e(k) = 0,8u(k — 1) + v(k) (ver Exercício 7.10). D 


Antes de descrever o algoritmo de variáveis instrumentais, parece instru- 
tivo fazer a seguinte distinção: o estimador EMQ é utilizado para estimar os 
parâmetros de modelos ARMAX que, como a própria sigla indica, modela o 
erro de equação como um processo MA. Por outro lado, o estimador GMQ 
é utilizado para estimar os parâmetros de um modelo de processo ARX 
além do modelo AR de um filtro. Para efeito de analogia, é conveniente 
dizer que nesse caso o filtro estimado é o inverso do modelo AR do erro. 
Com algum abuso de nomenclatura, pode-se dizer que o estimador GMQ 
estima os parâmetros de modelos ARARX. No caso de se modelar o erro 
de equação como um processo ARMA, resultaria em modelos ARARMAX 
(o sistema é modelado por um processo ARX e o ruído é modelado por um 
processo ARMA). Esse é precisamente o caso representado pela Eq. 7.19. 

Na prática, não se sabe qual é o tipo do ruído com o qual se está lidando. 
Nessa situação um algoritmo pode ter um desempenho melhor do que um 
outro em função de representar o ruído de forma diferente. O uso de mais de 
um algoritmo, quando os resultados não são satisfatórios, é recomendado. 


7.5 O Método das Variáveis Instrumentais 


Partindo-se de um modelo da forma y(k) = y”(k — 1)9 + e(k) e de um 
estimador do tipo ô = Ay, foi possível derivar as condições necessárias para 
que tal estimador não fosse polarizado. Tais condições foram derivadas e 
discutidas na Seção 6.2. A definição de polarização utilizada naquela seção 
foi a definição para pequenas amostras (PPA, veja Seção C.3 para detalhes). 
Uma alternativa à definição de polarização PPA é a polarização assin- 
tótica (ver Definição C.3.4). A idéia é relaxar um pouco a definição PPA 
e, por um lado, permitir que haja polarização para uma amostra pequena, 
mas por outro, verificar se tal polarização desaparece à medida que o tama- 
nho do conjunto de observações cresce. Assim, algumas das propriedades de 
interesse nesta seção dependerão do número de observações, N, sendo que 
tal dependência será indicada de forma explícita. Para fazer essa análise, 
inicialmente, será calculada a polarização assintótica de 8, como se segue: 


bh = Nim E(9(N)] — 6 
= plim[ô) - 6 
= plim[A(V0+e)]-0 
= plim[AYO + 4e] - 6 
= plim[Ae), (7.24) 
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sendo que no último passo foi assumido que AY = 1, como antes. Para 
que não haja polarização assintótica, deve-se garantir que plim[4e) = 0, 
resultado análogo à condição E(4e] = O para o caso PPA. 

Com o objetivo de derivar as condições para as quais plim[4e) = 0, 
A será decomposta no produto de duas matrizes que sejam funções das 
mesmas variáveis aleatórias. Ou seja, deseja-se ter A = BC, sendo que 
B=f(2) €ER"*" e C=g(2) EIR"*N, sendo z E IR” um vetor de variáveis 
aleatórias. Escolhendo z de forma a depender dos dados, as matrizes B e 
G podem ser definidas da seguinte forma: 


B=[Z'y! e C=Z. (7.25) 


É interessante notar que o estimador de mínimos quadrados também 
satisfaz as condições impostas sobre as matrizes B e C' até este ponto. 
Para o estimador MQ, B = [WTW]-! e C = WT, revelando que, para esse 
estimador, o vetor z é o próprio vetor de regressores w). Deve estar claro 
que a escolha em (7.25) também satisfaz AY = 1 e, portanto, resulta no 
estimador R 

dy = [ZW Z"y. (7.26) 


O estimador da Eq.7.26 é o estimador de variáveis instrumentais (VI), 
sendo que as variáveis que compõem o vetor z são as chamadas variáveis 
instrumentais ou instrumentos. Portanto, voltando à determinação da po- 
larização assintótica para o estimador da Eq. 7.24, tem-se 


b; 


plim [Ae] 
plim [(27W)-!Z7e) 
plim [(27W)-"] plim[Z7e], (7.27) 


sendo que na última equação foi utilizada a Propriedade C.3.2. Utilizando- 
se a Propriedade C.3.3, a última equação pode ser reescrita como 


bh = Nplim[(2"W)!]c, (7.28) 


sendo c o vetor de correlação cruzada entre as colunas de Z (geradas pelas 
variáveis instrumentais) e o ruído e. 

Até o momento não foi mencionado como escolher as variáveis instru- 
mentais. Entretanto, a última equação revela uma propriedade que tais 
variáveis devem ter de forma a garantir que a polarização assintótica do es- 
timador Ôvy seja nula. A condição é que as variáveis instrumentais e o vetor 
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de erro não devem ser correlacionados entre si de forma a se ter c=0. É in- 
teressante notar que, se o erro for ruído branco, c=0 para qualquer escolha 
genérica de z. Entretanto, se o erro for ruído colorido, haverá correlação 
entre e e os regressores de saída, conforme ilustrado no Exemplo 7.2.1. Isso 
significa que, se tais regressores forem escolhidos como variáveis instrumen- 
tais, erros do tipo ruído colorido induzirão polarização assintótica. Este é 
precisamente o resultado esperado, uma vez que se Z = Y então ôy= ôma- 

O estimador de variáveis instrumentais evita a polarização garantindo 
que o vetor de erro, que pode ser colorido, seja não correlacionado com 
as variáveis instrumentais. Essa condição é menos restritiva do que a de 
garantir que o vetor de erro não seja correlacionado com os regressores, 
como no caso do estimador MQ. O preço a ser pago envolve: i) a escolha 
das variáveis instrumentais, e ii) o estimador resultante é assintoticamente 
não polarizado, ao invés de ser não polarizado no sentido PPA, 


Exemplo 7.5.1. O estimador VI sem a propriedade de ortogonalidade 


À semelhança do estimador MQP, o estimador VI também é do tipo 
ô = Ay, mas para o caso do estimador VI tem-se A = [Z7W]-!ZT. Logo, 
a Eq.5.32 pode ser usada para testar se o estimador VI satisfaz a condição 
de ortogonalidade. Para esse estimador, tem-se 


VTWAy 
vTW(ZTW]-!ZTy 


VTy 
Vy, 


ls ds 


sendo que a condição não é satisfeita para o estimador em estudo, pelas 
mesmas razões discutidas na p. 234 deste livro. Esse resultado não deve 
causar nenhuma surpresa. A forma de o estimador VI evitar a polarização 
é diferente da forma usada pelo estimador EMQ, que ajusta um modelo 
para a parte modelável do erro de regressão, de forma a garantir que o 
resíduo seja branco. O estimador VI evita a polarização fazendo uso de 
variáveis instrumentais, ou instrumentos, correlacionadas com os dados, mas 
não (ou pouco) correlacionadas com o vetor de erro. Consegiientemente, o 
estimador VI não força os resíduos a serem brancos e, portanto, o vetor 
de resíduos não é ortogonal à hipersuperfície gerada pelos regressores do 
modelo. Uma conseqgiiência dessa característica é que a análise de resíduos 
— que normalmente objetiva verificar se os resíduos são brancos — não é 
diretamente aplicável a segiiências de resíduos de modelos cujos parâmetros 
são determinados usando-se o estimador VI. [a 


Antes de sugerir formas, de escolher as variáveis instrumentais, deve-se 
notar que a escolha não deve apenas evitar a correlação do vetor de erro com 


a 
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tais variáveis. A razão para se tomar esse cuidado é que as variáveis instru- 
mentais devem ser tão correlacionadas quanto possível com os regressores 
do modelo, caso contrário, a matriz Z” Y seria próxima de singular e sua in- 
versa, muito malcondicionada. Portanto, as variáveis instrumentais devem 
ser, idealmente, pouco correlacionadas com o erro e muito correlacionadas 
com os regressores do modelo. 

Seja y = Vômq + é a equação matricial obtida a partir de um modelo 
cujos parâmetros foram estimados usando o estimador MQ. A propriedade 
de ortogonalidade do método MQ garante que É L Y(9mq), sendo (0 mg) 
o vetor de predições de um passo à frente calculado usando-se a estimativa 
obtida por mínimos quadrados, ou seja, Y F(ômg) = Vôma- É importante 
notar que essa propriedade independe de ôma ser polarizado ou não (ver 
Exercício 7.13). Portanto, se o vetor de variáveis instrumentais para um 
modelo ARX for escolhido da seguinte forma: 


z=[9(k=1)... d(k-ny) u(k=1) .. u(k= nu], (7.29) 


claramente percebe-se que o vetor de variáveis instrumentais z está forte- 
mente correlacionado com o vetor de regressores 


VR =)=[n(k=1) mlk =n5) UR =) coculk no], (7:30) 


e pouco correlacionado com o vetor de erro se rue(T) = 0, Vr, uma condição 
discutida na Seção 4.2. Se o erro for ruído colorido, entretanto, haverá 
correlação entre e(k) e 1(ômg), pois, apesar de É 1 Y(ômq), o vetor de 
erro terá uma componente sobre a hipersuperfície gerada pelos regressores 
(veja Figura 6.3). A escolha de variáveis instrumentais em (7.29) não é a 
única (ver Exercício 7.13), como será ilustrado no próximo exemplo. 


Exemplo 7.5.2. O estimador VI 


Neste exemplo, o estimador VI será utilizado em três situações distintas. 
Em primeiro lugar, será considerado o caso em que há ruído de observação 
e este é branco. Os outros dois casos investigados usam erros do tipo ruído 
MA e AR na equação de regressão. Para cada caso, duas escolhas de variá- 
veis instrumentais foram testadas. Primeiramente, os regressores do sinal 
de saída, do tipo y(k — 1), foram substituídos pelas respectivas predições 
de um passo à frente, f(k — 1). Uma segunda alternativa substitui o ve- 
tor de regressores Y(k — 1) = [y(k — 1) u(k — 1)]” pelo vetor de variáveis 
instrumentais z(k — 1) = [u(k — 1) u(k — 2)J”. 

Os dados para a primeira parte do exemplo foram gerados pelo modelo 
vi(k) = 0,7y'(k — 1) + 0,5u(k — 1), com condições iniciais nulas e tomando 
u(k) como ruído branco, distribuição gaussiana com média zero e variância 
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unitária. A seguir, adicionou-se ruído de observação de tal forma a gerar 
v(k) = y'(k) + v(k), sendo v(k) ruído branco e gaussiano com Efu(k)]=0 e 
o2 = 0,04. Em todas as simulações numéricas deste exemplo foram usadas 
400 realizações com N = 500. 
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Figura 7.10: Estimador VI com ruído de observação 


Histogramas dos parâmetros estimados pelo estimador VI para o 
caso de ruído de observação branco. Os gráficos (a) e (c) cor- 
respondem aos valores dos parâmetros estimados pelo estimador 
MQ. Os gráficos (b) e (d) correspondem ao estimador VI com 
z2(k — 1) = [(k — 1) u(k — 1)J". Os valores reais dos parâmetros 
são (a,b) a = 0,7 e (cd) b= 0,5 (exvi 0). 


Conforme discutido na Seção 6.3.3, o estimador MQ é polarizado nos 
casos de ruído de observação branco se o modelo tiver regressores do tipo 
y(k =). O procedimento seguido para gerar a Figura 7.10 foi o seguinte: a 
partir dos dados e da equação de regressão y(k) = ay(k — 1) + bu(k — 1), os 
parâmetros foram estimados usando-se o estimador MQ. Como esperado, 
o parâmetro referente ao regressor y(k — 1) revela a polarização do esti- 
mador. Os histogramas dos parâmetros obtidos usando o estimador MQ 
são mostrados nas Figuras 7.10a e 7.10c. Esses mesmos parâmetros foram 
também usados para determinar o vetor de predições de um passo à frente 
7, fazendo-se j(k) = Ôjy(k — 1) + Ôpu(k — 1). A seguir, usou-se o vetor de 
variáveis instrumentais z(k — 1) = [9(k— 1) u(k— 1)]" para montar a matriz 
Z. Finalmente, o estimador (7.26) foi usado. 

A Figura 7.11 mostra resultados análogos para 0 caso em que o vetor 
de instrumentos é z(k — 1) = [u(k — 1) u(k — 2. Conforme pode ser 
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apreciado, essa escolha de variáveis instrumentais também foi adequada 
para evitar polarização, É interessante notar que o preço de se usar um 
vetor de instrumentos mais simples é a maior variância na estimativa de à. 
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FIGURA 7.11: Estimador VI com ruído de observação 


Histogramas dos parâmetros estimados pelo estimador VI para o 
caso de ruído de observação branco. Os gráficos (a) e (c) cor- 
respondem aos valores dos parâmetros estimados pelo estimador 
MQ. Os gráficos (b) e (d) correspondem ao estimador VI com 
z(k — 1) = [u(k — 1) u(k — 2)". Os valores reais dos parâmetros 
são (a,b) a = 0,7 e (c,d) b= 0,5 (exvi 0). 


Os resultados obtidos para o caso de erro MA na equação de regressão 
foram muito semelhantes aos representados nas Figuras 7.10 e 7.11, por isso 
não serão mostrados. Diferenças significativas, entretanto, foram observadas 
quando o erro de regressão era do tipo AR, conforme pode ser constatado 
a partir da Figura 7.12. 


Analisando-se o gráfico da Figura 7.12a, nota-se que o estimador MQ 
é fortemente polarizado neste caso, e que, apesar de reduzir a polarização, 
o estimador VI ainda é polarizado quando as variáveis instrumentais são 
escolhidas como sendo z(k — 1) = [j(k — 1) u(k — 1)J". A razão para isso é 
que, pelo fato de ôma ser bastante polarizado, o mesmo é verdadeiro para 
Y. Portanto, a predição de um passo à frente ainda está correlacionada com 
o erro, o que resulta em polarização do estimador VI (veja a explicação logo 
após a Eq. 7.30). 
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FIGURA 7.12: Estimador VI com erro AR de regressão 


Histogramas dos parâmetros estimados pelo estimador VI para 
o caso de erro de regressão do tipo ruído AR. Os gráficos (a) 
e (c) correspondem aos valores dos parâmetros estimados pelo 
estimador MQ. Os gráficos (b) e (d) correspondem ao estimador 
VI com variáveis instrumentais z(k — 1) = [j(k — 1) u(k — 1)J". 
Os valores reais dos parâmetros são (a,b) a = 0,7 e (c,d) b = 0,5 


' (exvi O). 


Uma maneira de contornar a polarização é escolher outras variáveis ins- 
trumentais que sejam menos correlacionadas com o vetor de erro do que as 
predições de um passo à frente. Como visto anteriormete, uma alternativa 
é fazer z(k — 1) = [u(k — 1) u(k — 2)JT. A Figura 7.13 mostra que essa 
escolha é satisfatória. 

Em conclusão, pode-se dizer que o desempenho do estimador VI depende 
do tipo de erro de regressão, bem como da escolha das variáveis instrumen- 
tais. Quando o estimador MQ for severamente polarizado, a predição de um 
passo à frente p”(k — 1)ôuq ainda será significativamente correlacionada 
com o vetor de erro de regressão. Nesses casos é preferível usar entradas 
como variáveis instrumentais. D 


Um aspecto não explorado, e que certamente terá influência sobre o 
desempenho dos diversos estimadores, é a estrutura do modelo. Nos exem- 
plos deste capítulo foi usada a mesma estrutura do modelo empregado para 
gerar os dados. Infelizmente, em situações práticas a estrutura do mode- 
lo não será conhecida a priori e sua determinação passará a fazer parte 
do problema de identificação. Técnicas para auxiliar na determinação da 
estrutura do modelo serão apresentadas no Capítulo 12. 
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FIGURA 7.13: Estimador VI com erro AR de regressão 


Histogramas dos parâmetros estimados pelo estimador VI para 
o caso de erro de regressão do tipo ruído AR. Os gráficos (a) 
e (c) correspondem aos valores dos parâmetros estimados pelo 
estimador MQ. Os gráficos (b) e (d) correspondem ao estimador 
VI com os instrumentos: z(k—1) = [u(k—1) u(k—2)]T. Os valores 
reais dos parâmetros são (a,b) a = 0,7 e (cd) b= 0,5 (exvi 0). 


7.6 Complementos 


Complemento 7.1. O estimador de mínimos quadrados totais 3 


O estimador de mínimos quadrados totais (MQT) foi idealizado para 
reduzir a polarização nos casos em que há ruído de medição branco tanto 
no sinal de saída quanto no de entrada. Ou seja, o estimador MQT é 
especialmente projetado para ser usado no “problema de erros nas variáveis” 
descrito na Seção 6.3.3. À fim de melhor entender a diferença que existe com 
respeito ao estimador MQ, o problema resolvido por mínimos quadrados 
pode ser expresso da seguinte forma: seja a equação matricial y = Y6, com 
ye IR” e 6 E IR"º, o estimador MQ procura resolver o seguinte problema: 


min Ily-FIP, 
sERN (7.31) 


Se E 
3VAan HurrEL; VANDEWALLE, 1991. p. 33. 
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sujeito a y E R(Y), ou seja, Y deve pertencer ao espaço gerado pelas colunas 
de Y. Seja Ymq à solução para o problema (7.31), então qualquer O que sa- 
tisfaça Ymq = Vômq será uma solução do problema de mínimos quadrados. 
Pode ser mostrado que se o posto da matriz Y for tal que rank(V] = no, 
então o problema de mínimos quadrados tem solução única, conforme visto 
no Capítulo 5. 

Uma possível interpretação é que o estimador MQ perturba o vetor de 
observações y de uma quantidade É mínima, de forma que j = y — É possa 
ser explicado pelos regressores, que geram as colunas de Y. A suposição 
implícita nesse procedimento é que os regressores são conhecidos perfeita- 
mente. Tal suposição falha, por exemplo, quando os sinais de entrada e 
saída são observados com ruído. Uma alternativa é introduzir perturba- 
ções também em Y e não apenas em y. Isso leva ao problema de mínimos 
quadrados totais: 


min |[Wy)-[É gugr) Ie, 
Ve IR(Nxno) (7.32) 
Ymgr ER” 


sujeito a Ymgr € R($), ou seja, Ymqr deve pertencer ao espaço gerado 
pelas colunas de &. No problema acima, || ||k indica a norma de Frobenius. 
Tendo achado [Y y] — [É Ymqr)] que satisfaça (7.32), o vetor de parâmetros 
estimado é uma solução de fmgr = Yômgr. As condições para que o 
estimador MQT seja não polarizado e consistente são: 


1) Y deve ter posto pleno de colunas; 


2) os erros de observação, tanto dos regressores de saída quanto dos 
regressores de entrada, devem ser: i) independentes e identicamente 
distribuídos, ii) variáveis aleatórias brancas (ou seja, com matriz de 
covariância da forma 021). 


A forma fechada do estimador MQT é 


ômqr = (UV or) W"y, (7.33) 


sendo que Ong+1 é O (ny + 1)-tsimo valor singular, obtido decompondo-se 
a matriz estendida [Y y] usando-se a decomposição em valores singula- 
res descrita na Seção B,4, Uma outra forma de determinar ômgr é, se 
Ung+ng+1 f 0, 


1 
[vino+ +++ Ungmo+ 1], (7.34) 


ômgr EE sei 
Vng+Lng+1 | 
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sendo vi; O (ij)-ésimo elemento da matriz V (ver Eq.B.14). O próximo 
exemplo ilustra o desempenho do estimador MQT. 


Exemplo 7.6.1. Solução do problema de erro nas variáveis 


Neste exemplo os dados ideais serão gerados por 


v(k) = Loy(k=1)-0,7y'(k- 2) +0,5ui(k — 1), 


sendo que u!(k) 6 um sinal aleatório com distribuição normal, média nula e 
variância o2 = 1, Os resultados são mostrados na Figura 7.14, 


% % 
8 8 
3% Bu 
[ É) 
as MA TAS 5 188 MO 185 TA 14 15 185 
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5 5 
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Figura 7.14: Eliminando polarização com o estimador MQT 


Histogramas de valores estimados usando os estimadores MQ e 
MQT quando os sinais de entrada e saída têm ruído de medi- 
ção branco. Os gráficos (a,c,e) correspondem ao estimador MQ 
e os gráficos (b,d,f) correspondem ao estimador MQT. Os valo- 
res reais dos parâmetros são: (a,b) 8 = 1,5; (cd) 8) = -0,7 e 
(ef) 63 = 0,5 (tis O). 
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Tanto o sinal de entrada quanto o de saída são observados com ruído 
branco, de média nula e variância 0,04. Isso é representado da seguinte 
forma: y(k) = yi(k) + ey(k) e u(k) = ui(k) + eu(k). Além disso, ey(k) e 
eu(k) não estão correlacionados. O sistema acima é o mesmo de um dos 
sistemas usados no Exemplo 6.3.4. 

Conforme pode ser visto na Figura 7.14, o estimador MQT eliminou a 
polarização completamente, ao passo que o estimador MQ está claramente 
polarizado, conforme esperado. Deve ser notado que o estimador MQT não 
elimina o problema de polarização no caso de modelos de erro de equação. 
Nesses casos, estimadores do tipo EMQ, MQG, VI ou semelhantes devem 
ser utilizados. D 


Complemento 7.2. Estimação de densidade espectral de potência 


Este complemento trata da estimação da função de densidade espectral 
de potência a partir dos parâmetros de modelos ARMA, lembrando que 
modelos AR e MA são casos particulares. Nesse sentido, o presente com- 
plemento assemelha-se ao material da Seção 4.4.1, sendo que a principal 
diferença reside em que naquela seção o objetivo era estimar a resposta 
em fregiiência a partir de espectros dos sinais envolvidos. Tais espectros 
eram determinados como a transformada discreta de Fourier das funções 
de correlação correspondentes. Neste complemento, por outro lado, o ob- 
jetivo é estimar a densidade de espectral potência usando-se os parâmetros 
de modelos ARMA, ou variantes. À justificativa para localizar o presente 
material neste capítulo é que frequentemente (mas não necessariamente) os 
parâmetros de modelos ARMA são estimados pelo estimador EMQ, descrito 
na Seção 7.2, 

Seja um sinal discreto y(k) com período de amostragem Ts em segundos. 
A densidade espectral de potência desse sinal é dada por 


oo 


Pylf) = T y ryy(k)e ini, (7.35) 


k=-o0 


F (Eluliyli — k))) 


que é a transformada discreta de Fourier (TDF) da função de autocorrelação 
do sinal ryy(k). À presença de Tg duas vezes na Eq. 7.35 ajusta a escala da 
TDF pelo tempo de amostragem de maneira a permitir o correto cálculo de 
potência na faixa desejada de fregiiências. Para ver isso mais claramente, 
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observe que ao invés de simplesmente se ter e-vk tem-se e-ivkTa, ou seja, 
ao invés de tratar o problema de forma adimensional, k — que indica a 
k-ésima amostra — é substituído por kT; indicando o tempo em segundos 
em que se localiza a k-ésima amostra, ou observação. 

Dizer que o sinal y(k) pode ser representado pela saída de um filtro 
C(q)/A(q) excitado por ruído branco v(k) com variância o2 é equivalente 
a dizer que y(k) é a realização de um processo estacionário ARMA (ver 
Eq. 2.49). Assim sendo, aplicando-se a definição de função de autocorrelação 
ao sinal y(k) e substituindo-o pelo seu modelo ARMA, tem-se: 


rol) = Plo(du(i =] 
ECO, CUM 
= Ela)" at/g) "6 +) 
= GOO PU = 
clacl/o. | 
= AlA(i/) "et Nm) 


em que os polinômios C(q) e A(q) foram considerados determinísticos. O 
aparecimento de 1/q como variável independente dos polinômios C(1/q) e 
A(1/q) se deve ao fato de que o sinal v(i - k) (ao qual tais polinômios 
estão associados) está sendo “percorrido” em tempo negativo. Em outras 
palavras, à medida que k vai de zero a infinito em rov(k), v(i — k) está 
sendo percorrido em direção oposta, ou seja, em direção a —00. Isso é o que 
foi chamado de tempo negativo. Em tempo negativo, o operador de atraso 
q”! funciona como um operador de avanço dr =q. Portanto, em tempo 
negativo é necessário inverter-se o operador q. Os polinômios C(q) e A(q) 
são definidos em termos do operador de atraso, como pode ser visto em 
(2.40). Portanto, a substituição nesses polinômios de q-! por q é indicada 
por C(1/9) e A(1/9). 
Tomando-se a TDF em ambos os lados de (7.36) resulta em 


Clajc(1/9) 
A(a)A(1/9) 


Finalmente, escalonando (7.37) pelo tempo de amostragem e lembrando 
que v(k) é branco (portanto &,(w) é constante com valor 02), tem-se 


dy(w) d,(u). (7.37) 


q=e-is 


By(f) 


H 


Tooê 


ol 
1+ DM ce —j2mfiTs |2 
E Dt a eritnfiTs 


] 


Too? v 


: (7.38) 
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em que foram utilizadas as definições dos polinômios C e A em (2.40). 
Conforme visto na Seção 7.2, o resíduo €(k) do modelo estimado ARMA 
serve como aproximação para v(k). Portanto, a expressão (7.38) pode ser 
utilizada para se estimar a densidade espectral de potência a partir dos 
parâmetros estimados (â1,... ;ân,501,--- +ên, ) de um modelo ARMA e da 
variância do respectivo vetor de resíduos of = oi. 

Deve ser notado que se o sistema que gerou o sinal y(k) for melhor 
representado como um processo AR, a mesma expressão (7.38) pode ser 
utilizada para obter uma estimativa do espectro tomando-se c; = 0. O 
mesmo vale para um processo MA, para o qual a; = 0, em (7.38). 


Leitura Recomendada 


O assunto tratado neste capítulo é padrão na área de identificação de sis- 
temas e muitos livros descrevem e analisam em detalhes os principais al- 
goritmos. Ljung (1987) e Norton (1986) descrevem o estimador EMQ no 
contexto de estimação recursiva, assunto a ser tratado no próximo capítulo. 
Mendel (1987) desenvolve detalhadamente as equações do estimador GMQ 
(também chamado de BLUE, do inglês best linear unbiased estimator). Para 
isso, o autor faz o projeto de um estimador impondo que seja não polarizado 
com variância mínima do erro de cada parâmetro estimado. 

Young (1970) trata de diversos aspectos práticos do estimador VI. Por 
outro lado, Sôderstrôm e Stoica (1989) dedicam um capítulo inteiro ao estu- 
do detalhado desse estimador. Detalhes sobre o estimador MQT podem ser 
encontrados em (VAN HUFFEL; VANDEWALLE, 1985; 1991). Finalmente, 
o problema de estimação espectral é abordado detalhadamente em livros 
específicos (MARPLE JR., 1987). 


Exercícios 


7.1, Mostre que o estimador MQ não é polarizado na estimação de modelos 
MA (ou seja, um modelo ARMAX com A(g) = C(q) = 1), mesmo que o 
ruído na equação de regressão seja autocorrelacionado (AR ou MA). 


7.2. Utilizando o pacote computacional de sua preferência, construa a 
matriz de covariância de um vetor de ruído branco v(k). A seguir, de- 
termine o ruído colorido e(k) = 0,8u(k — 1) + v(k) e compute a matriz de 
covariância de e(k). Analise o condicionamento de cada uma das matrizes. 
Sugestões: 1) trabalhe com vetores relativamente curtos, por exemplo, com 
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20 pontos; 2) um índice que pode ser usado para medir o condicionamento 
de uma matriz é min[| AR |]/max/| AR |], em que AR indica os autovalores 
de R. 


7.3. Explique a razão pela qual o estimador EMQ não é polarizado na 
presença de ruído de atuador, mas o é no problema de erros nas variáveis. 


7.4, Mostre que o estimador GMQ é equivalente ao estimador MQP quando 
a matriz de pesos é a inversa da matriz de covariância do ruído. Explique 
intuitivamente como o uso de tal matriz de pesos reduz a polarização do 
vetor de parâmetros estimados. 


7.5. Mostre que o estimador MQP é, em geral, polarizado. Use figuras 
semelhantes a 5.2 e 6.3 para auxiliar na discussão. 


7.6. Mostre que tomando a Eq. 7.23 ao longo de uma janela de dados resulta 
em um conjunto de restrições que pode ser escrito na forma de (7.15). 


7.7, Compare criticamente o estimador generalizado de mínimos quadrados 
iterativo com o estimador estendido de mínimos quadrados. Preste especial 
atenção na forma com que tais estimadores modelam o ruído. 


7.8. Seja o modelo de processo 


alyal 
vt) = Tu) = Trata) (7.39) 


e o modelo de ruído 


1 


vlh) = pr) = Tra 


v(k) . (7.40) 


Pede-se: i) usando o ruído, v(k), gaussiano com média zero, mostre por 
simulação que w(k) não é branco; ii) ignore o fato de w(k) não ser branco 
e estime A e B usando o estimador MQ; iii) mostre a ocorrência de pola- 
rização usando esse estimador; iv) estime parâmetros usando o estimador 
GMQ; v) mostre que houve diminuição na polarização; vi) tente recuperar 
(estimar) o filtro descorrelacionador de ruído D. 


7.9. Mostre que o erro de regressão na equação (7.20) pode ser escrito como 
€(k) = Ay(k) — Bu(k). Esse erro é branco? 
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7.10. No Exemplo 7.4.1 dois tipos distintos de ruído foram usados, MA e 
AR. Em ambos os casos os modelos de ruído eram de primeira ordem. O 
estimador GMQ foi então usado, sendo que, quando o ruído era do tipo MA, 
obteve-se Efê] = 0,5 (ver Figura 7.7), ao passo que quando o ruído era do 
tipo AR estimou-se E[ê) = 0,8 (ver Figura 7.9). Suponha que o desempenho 
do estimador tenha sido aprozimadamente equivalente em ambos os casos 
(compare as Figuras 7.6 e 7.8). Essa suposição sugeriria que o modelo de 
ruído AR e(k) = 0,5e(k— 1) + vi (k) é uma aproximação do modelo de ruído 
MA e(k) = 0,822(k — 1) + va(k), sendo mi(k) e va(k) os resíduos em cada 
caso. Por quê? Discuta essa afirmativa. 


7.11. Em vários problemas é necessário utilizar uma estimativa da variância 
do ruído o2. Como aproximaria essa grandeza nas seguintes situações: i) o 
ruído é branco; ii) o ruído é um processo MA; iii) o ruído é um processo 
AR. 


7.12. Repita o Exemplo 7.4.1, mas desta vez utilize o estimador EMQ. 
Ajuste a estrutura do modelo de ruído, se necessário, até eliminar a polari- 
zação. Compare os resultados com aqueles descritos no Exemplo 7.4.1. Se 
o erro na equação de regressão não fosse branco e supondo que a estrutura 
do modelo fosse conhecida, que estimador escolheria para estimar o ruído? 


7.13. Discuta as vantagens e desvantagens de se escolher as variáveis ins- 
trumentais da seguintes formas: 


1 z(k) = d(k); 
2. 2(k-1)=u(k — 1) de forma que r:y(0) = ruy(0) e Tzu(0) = ruu(0); 
3. z(k— 1) = y(k — 2) de forma que r.y(0) = ryy(1) e rzu(0) = ryu(1); 
4. dk-1)=y(k-1)-e(k-—1). 
7.14. Mostre que o estimador VI não é sensível a transformações lineares 
não singulares da matriz de variáveis instrumentais. Em outras palavras, 
mostre que o vetor estimado, usando-se o vetor de variáveis instrumentais z, 


permanece inalterado se for usado um conjunto de variáveis instrumentais 
que seja combinação linear de z. 


7.15. Usando os dados do arquivo prbsa02 O, estime modelos ARMAX. 
Também, modele o ruído como um processo auto-regressivo e obtenha mode- 
los (ARARX). Compare todos os modelos obtidos entre si e com os modelos 
obtidos no Exercício 5.9. Discuta os resultados. 
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7.16. Proponha um estimador não polarizado para estimar os parâmetros 
do modelo (6.28). Mostre que tal estimador será polarizado na estimativa 
dos parâmetros do modelo (6.26). Discuta sobre a possibilidade de definir 
um estimador não polarizado, como os apresentados no presente capítulo, 
para estimar os parâmetros do modelo (6.26). 


7.17, Tente aplicar o estimador MQE ao caso estudado no Exemplo 6.3.5. 
Discuta quais dificuldades são encontradas nesse caso, Tais dificuldades im- 
pedem o uso bem-sucedido do estimador MQE na estimativa dos parâmetros 


do modelo (6.19)? 
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Estimadores Recursivos 


8.1 Introdução 


Até o momento tem-se considerado o caso em que toda a massa de dados 
está disponível antes de começar a estimar parâmetros. Nesse caso, tendo 
definido a estrutura do modelo, monta-se a matriz de regressores e resolve- 
se o problema numérico “de uma só vez”, ou seja, em batelada. Na prática, 
a situação acima é encontrada, por exemplo, quando os dados de entrada 
e saída de um determinado sistema são previamente coletados e deseja-se 
utilizá-los a posteriori para obter um modelo. 

Uma outra situação, também comum na prática, ocorre quando os dados 
são medidos e disponibilizados seqiencialmente. Ou seja, a cada período 
de amostragem, um sistema qualquer de coleta de dados fornece medições 
correspondentes àquele instante. Obviamente, os dados poderiam ser ar- 
mazenados até se ter um número suficiente para resolver o problema em 
batelada. Mas será que é possível utilizar os dados sequencialmente para 
atualizar o vetor de parâmetros de um determinado modelo? A resposta a 
essa pergunta é afirmativa e o procedimento é conhecido como estimação 
recursiva. 

Técnicas recursivas são muito úteis por dois motivos, O primeiro deles 
foi mencionado acima, ou seja, é possível, utilizando técnicas recursivas, es- 
timar os parâmetros de um determinado modelo à medida que os dados do 
processo são disponibilizados. Isso é útil quando os parâmetros do processo 
variam lentamente em função de não-lincaridades, desgaste, falhas, dentre 
outros. Algoritmos desenvolvidos para esse fim são denominados de algo- 
ritmos recursivos. Em segundo lugar, tais algoritmos são também úteis na 
resolução de problemas numéricos cuja solução em batelada seria difícil. 

No presente capítulo serão estudados alguns algoritmos recursivos tendo 
em vista ambos os motivos mencionados acima. Algumas pequenas modifi- 
cações serão feitas na nomenclatura. Neste capítulo, o subíndice k indicará 
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a iteração do respectivo algoritmo recursivo. Ainda com respeito à nomen- 
clatura, neste livro é feita distinção entre estimação recursiva e estimação 
em tempo real (on-line estimation). Os termos estimação em batelada e 
estimação of-line também são considerados distintos. Estimação recursiva 
e estimação em batelada dizem respeito ao algoritmo. Se o mesmo processa 
os dados todos de uma só vez, diz-se que tal algoritmo faz estimação em 
batelada. Se os dados são processados segiiencialmente, diz-se que a esti- 
mação é recursiva. Por outro lado, a denominação tempo real 1 refere-se ao 
fato de o processamento (que tanto pode ser recursivo como em batelada) 
ocorrer suficientemente rápido de maneira que o resultado esteja disponível 
para influenciar o processo sendo monitorado ou controlado. 

É interessante notar que, a rigor, algoritmos recursivos podem ser exe- 
cutados em tempo real, ou não. Semelhantemente, algoritmos de estimação 
em batelada podem, em princípio, ser executados tanto em tempo real ou 
não, Contudo, quando se pensa numa aplicação em tempo real, o mais co- 
mum é implementar algoritmos recursivos. Esse é o assunto deste capítulo. 


8.2 Atualização Recursiva 


Seja o sistema y(k) = 70 +e(k), sendo E[e(k)]=0 e cov[e(k)] = R. No que 
se segue os subíndices indicam as iterações do algoritmo recursivo. Portanto, 
um modelo para o sistema acima pode ser escrito da seguinte maneira: 


u(k) = WE(k — 1)dp + E(k), (8.1) 


sendo que o vetor de regressores yy(k — 1) E IR"? é formado na iteração 
k com informação disponível até a iteração k — 1. No desenvolvimento a 
seguir, para facilitar, será omitida a indicação (k — 1). ô, E IR"º indica o 
vetor de parâmetros estimado na iteração k. 

No contexto de estimação recursiva, é interessante expressar ôy em fun- 
ção do último valor estimado, ou seja, 4-1. Além disso, a nova estimativa 
deve, de alguma forma, incorporar informação atualizada que vem na medi- 
ção y(k), no instante k. A fim de tentar atender a esses requisitos, propõe-se, 
então, escrever 


dp = Jp + Keylk), (8.2) 


ou seja, o vetor de parâmetros no instante k é expresso como uma com- 
binação linear do seu valor no instante anterior e do valor da medição no 


*Os termos em inglês on-line e off-line são comumente usados para indicar algoritmos 
que são executados em tempo real e aqueles que não o são. 
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instante k. Esse procedimento será denominado atualização recursiva. Na 
Eq.8.2 Jp € IR"*N0 e Ky € IR"9X! são matrizes que deverão ser determi- 
nadas de tal maneira a garantir que Oy seja uma boa estimativa. Mas o 
que é uma boa estimativa? Em função das discussões nos Capítulos 6 e 7, 
parece razoável impor as seguintes restrições: i) 0x deve ser não polarizado, 
ou seja, E[ô,] = O = 0; ii) cov[ô,) deve ser tão pequena quanto possível. 
A aplicação das duas restrições mencionadas anteriormente será feita nas 
Seções 8.2.1 e 8.2.2, a seguir. 


8.2.1 Atualização recursiva não polarizada 
Impondo-se que o esquema de atualização recursiva deva ser não polarizado, 


tem-se 


0 = El(ô,) 
= JE(0,-1] + KyEly(k)] 
Jk9 + Ku ElWZÔ,] + KyBlé(k)). (8.3) 


A fim de obter (8.3), foi considerado que o vetor estimado não é polariza- 
do (ver Exercício 8.1). Considerando a média dos resíduos nula (isso de 
certa forma está implícito no fato de se considerar o vetor estimado não 
polarizado) e os regressores determinísticos, tem-se 


= JO + Kyb;0 
1 = J+Kybk 
dk = 1-Kwk. (8.4) 


Portanto, a Eq.8.2 pode ser reescrita como se segue: 


à; 
à; 


(1 = KybE)dk=1 + Ky(k) 
Bai + Klu(h) — Rôh-1). (8.5) 


Deve ser observado que pelo fato de se estar derivando um algoritmo 
recursivo não é necessário montar a matriz de regressores 'Y, e passa-se a 
usar o vetor de regressores 1. 

A Eq.8.5 determina o novo valor estimado de 8, como sendo o valor 
estimado na iteração anterior mais uma parcela de correção. Esta, por 
sua vez, depende de um ganho, Kk, e de (y(k) — b70k-1). Deve estar claro 
para o leitor que a parcela entre parênteses é precisamente o erro de predição 
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cometido pelo modelo ao predizer o valor medido correspondente ao instante 
k utilizando o vetor de parâmetros conhecido no instante anterior, ou seja, 
no instante k — 1, Essa parcela é conhecida como inovação e será indicada 
por 


n(k) = y(k) — bFÔk-1. (8.6) 


Note que a diferença entre as inovações e os resíduos é que apenas os 
resíduos são calculados utilizando o valor atualizado dos parâmetros, ou 
seja, E(k) = y(k)- -Wrôp. Portanto, na prática, primeiramente se determina 
n(k), com isso pode-se determinar Ôy (usando a Eq. 8.5), e só então podem 
ser calculados os resíduos €(k). Obviamente, para determinar Ô,, além de 
n(k), é necessário conhecer Ky. Essa matriz de ganhos será determinada 
a seguir impondo-se a segunda restrição mencionada acima, ou seja, que a 
covariância do esquema de atualização recursiva seja mínima, 


8.2.2 Atualização recursiva não polarizada de mínima 
covariância 


A seguir, P; = cov[9,] € IR"X"º indicará a matriz de covariância calculada 
na iteração k. Usando a definição de covariância (ver Eq. C.1.3), tem-se 


P = E[(ô, - ElôeD(ôs - Efô,)"] 
E [(ô, - Os), - 047") 


BÍ(=Kavide+ Key) 04) (07), (87) 


sendo que (s)T indica o transposto do conteúdo do parênteses anterior. 
Para obter (8.7), substituiu-se 9 de acordo com a Eq. 8.5 e também fez-se 
E[ô,] = 9, uma vez que foi imposto que o procedimento seguido seja não 
polarizado. Somando-se e subtraindo-se a matriz Kk)k0p nos parênteses 
da Eq.8.7, chega-se a (ver Exercício 8.2) 


Pk 


B[(( = Kebe)lda- — 04) + Kulyth) — 4704)) (0)"] 
[((1 = Kiba — 04) + Kiel) (97] (88) 


H 


Considerando-se que o ruído e(k) não está correlacionado com o vetor de 
regressores 1), nem com (94-10) — o que de certa maneira está implícito 
na imposição de que o estimador seja não polarizado —, pode-se reescrever 
a Eq.8.8 como se segue: 
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Pr = E[U=IiyE)(Õe-s — 0WNy-s — 06 TT = Ka] 
+E[Kye(k)e(k)” Kg). (8.9) 


Considerando-se os regressores determinísticos, tem-se 


PB = (I-KyDE [(du-1 - 0, (8p-1 — 84"] (1 = Kg)” 
+KyE fe(k)e(k)") KG. (8.10) 


Supondo que o ruído tem média nula, tem-se 


Pr = (1-Kwbk)Pr(I = Kybk)” + KERKG, (8.11) 


sendo covfe(k)] = R = E[e(k)e(k)”] (ver Exercício 8.3). No caso monova- 
riável, e(k) é um escalar e, portanto, R = o2 é simplesmente a variância 
do ruído. À última equação está na forma recursiva, no sentido de que a 
matriz de covariância do estimador na iteração k, Pk, é determinada em 
função do seu valor na iteração anterior, k — 1. Entretanto, ainda é neces- 
sário determinar Ky. Como a restrição é que o estimador seja de mínima 
covariância, o problema a resolver é achar Ky tal que P; seja minimizado. 
Se P, fosse uma função contínua, bastaria calcular a derivada parcial de Pk 
em função de Kk e igualá-la a zero. Entretanto, P, é uma função discreta e 
nesse caso deseja-se minimizar a variação AP, provocada por uma variação 
AKy,. Assim, chamando Pf = Pk + AP; o novo valor de Pk devido a uma 
variação em Kk, tem-se 


AP, = Pi-P 
AP; = (1-(K + AK) WE) Proa (1 — (Kk + AKGPR)" + 
(Kk + AK)RKk + AKi” — 


(1 = Kyypk) Pk-a(I — Kypp)” — Ki RKG. 


Desprezando-se os termos quadráticos em A KY e igualando-se a expres- 
são resultante a zero, obtém-se após algum algebrismo 


AP; = AKi-PiPe (1 — br Kk) + RK$] 
=[((1 = Kybk) Pre — KER] AKg. (8.12) 
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A fim de se obter a última equação, os termos quadráticos em AKy foram 
desprezados uma vez que, em se tratando de um problema de minimização, 
faz-se AX > 0 e deseja-se verificar a condição na qual AP, = O para 
valores muito pequenos de AK,. Portanto, para que AP, = 0, ambos os 
termos entre colchetes na Eq. 8.12 devem ser nulos. Essas condições geram 
as seguintes equações: 


S 
H 


Pk Proa(I — Pak) + RKG 
(1 Kypk) Perth — KkR. 


S 
H 


Finalmente, da última equação, tem-se 


Kb Pr-1Pk + R) 
Kk 


Prrbk 
PrrbilWbe Pr bk + R)TI. (8.13) 


As Egs.8.5, 8.11 e 8.13 compõem um algoritmo recursivo para a esti- 
mação do vetor 9. Uma ordem adequada para o seu cálculo é: 


Ky = Prrba(Wk Pr-rbe + RT; 
dy = 0-1 + Ke(y(k) — W5Ôp-1); (8.14) 


Pr = (1 = Kb) Pr = Ka)” + KERK. 


É interessante notar que os elementos da diagonal principal da matriz 
de covariância P, são as variâncias dos respectivos elementos no vetor de 
parâmetros e, portanto, indicam o grau de confiança que se tem nos valo- 
res estimados dos elementos de 0. Quanto maior for a confiança em um 
determinado valor, tanto menor será o valor correspondente na diagonal 
principal de Pp. Assim sendo, os elementos de 8, nos quais se tem menos 
confiança sofrem maior correção, como seria de se esperar. 

A dimensão da matriz [1p; Pk-1tbp + R] 6 igual ao número de saídas 
medidas. Se y(k) for um escalar, o algoritmo recursivo acima derivado 
envolve apenas a inversão do escalar 1h; Pk-1tbk + 02, sendo que o? é à 
variância do ruído e(k), 

Em se tratando de um algoritmo recursivo, é necessário inicializá-lo 
antes de proceder à primeira iteração. Chamando o valor inicial do vetor 
estimado de do, na primeira iteração tem-se 


Digitalizado com CamScanner 


8.3 EstIMADOR Ricunsivo DE MÍNIMOS QUADRADOS 323 


wTôr 
= ap [do + 161 (p(1) = yTôo)] 
VT [do + Povoa + 97! (p(0) — 700) . (8.19) 


(1) 


Se Wi Poty, > R (isso pode ser conseguido para valores elevados de Po) a 
última equação pode ser aproximada por: 


DU) = tdo + bT Pon (7 Pora) (a) 
= 467 Pop (7 Pour "ao 
= 700 + y(1) = ido = y(1). (8.16) 


Portanto, percebe-se que se os elementos de Py € IR"9Xn9 forem inicia- 
lizados com valores suficientemente elevados, a condição inicial do pratica- 
mente não afeta a qualidade da predição de um passo à frente. Sendo assim, 
é comum inicializar o algoritmo recursivo com um vetor de parâmetros nu- 
lo, ou seja, do = 0, e com uma matriz de covariância grande, tipicamente 
1x 10 <P, <Ix 10, sendo que 1 € IR?8X" é à matriz identidade. 
Há casos em que se tem conhecimento a priori dos valores dos parâmetros, 
como, por exemplo, valores de parâmetros estimados anteriormente (pos- 
sivelmente em batelada) ou mesmo valores nominais de parâmetros físicos 
do sistema em estudo. Tais valores podem ser utilizados para inicializar o 
algoritmo recursivo com a vantagem de acelerar a convergência aos valores 
atualizados dos parâmetros. 


8.3 Estimador Recursivo de Mínimos Quadrados 


O ponto de partida na seção anterior foi o vetor estimado 8. e a medi- 
ção y(k). A questão central foi como usar a nova informação, y(k), para 
atualizar o vetor estimado, 9. Em nenhum momento na Seção 8.2 foi 
explicitamente utilizado o fato de que o estimador seria o de MQ ou qual- 
quer outro, por isso o procedimento ali derivado foi chamado simplesmente 
de atualização recursiva, O objetivo nesta seção é derivar um algoritmo 
recursivo baseado no estimador MQ discutido no Capítulo 5. 

O ponto de partida é o modelo y(k) = p"(k—1)9-+€(k) e uma segiiência 
de dados, representados em y(k) e W(k — 1), k = 1,..., para a qual não é 
necessário considerar um limite de tamanho. Deseja-se estimar Ô de forma 
recursiva. Para isso, o estimador MQ será escrito da seguinte forma (ver 
Eq. 5.45 e Exercício 5.5): 
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k 
ômqr = Sue] [ve rua) (8.17) 
=1 


A seguir será usada a seguinte notação: 


k -=1 
Ah = Dove-nyre-a) j 
i=1 
k-1 
Pp! = Eve =W'(i- ) +blk — DpT(A — 1) 
i=1 


PRA, + pk = 1pT(h = 1). (8.18) 


A idéia básica no desenvolvimento acima é a de expressar grandezas em 
um determinado instante k em função de valores em instantes passados. 
Esse é o princípio de algoritmos recursivos e é uma das razões pelas quais a 
representação (8.17) é tão útil nesse contexto. Para facilitar a comparação 
com os resultados da seção anterior, note que no desenvolvimento acima 
W(k — 1) = yy. Seguindo-se um procedimento análogo e omitindo-se a 
indicação MQ, o estimador (8.17) pode ser reescrito como se segue: 


k-1 
dk = P vt 169 + ve = mto (8.19) 


i=1 


Escrevendo-se (8.17) para o instante k — 1, obtém-se 


k-1 k-1 
DP wli = 1p"(i ) di1= p Wli- 1v6] , (8:20) 
i=1 


i=l 


sendo que o lado Roque da equação pode ser representado em forma 
compacta como sendo P, !ôp- 1. Substituindo-se esse resultado na Eq. 8.19, 
chega-se a 


de = Pi (Pride + Ult Dub] 

= P[(PE! = (6 = 1)bT(K = 19) dea + (6 — Di] 

= dp Papk = D)pT(k — 1)0p-1 + Prp(k — Dy(k) 

= dpi +PW(k=1) [6x =-WT(k- di) 

= 0p1+Kin(k), (8.21) 
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sendo Ky = Pr(k — 1) uma matriz de ganho e n(k)=y(k)-bT(k — 1)0p-1 
a inovação no instante k, 

A última equação torna evidente que para usar o algoritmo recursivo 
em questão é necessário calcular Pk. O uso direto de (8.18) para esse fim é 
inadequado, uma vez que tal equação requer uma inversão de matriz a cada 
iteração do algoritmo. Uma expressão numericamente mais vantajosa pode 
ser obtida aplicando-se o lema da inversão (ver Lema A.4.1). Isso resulta 
na seguinte equação (ver Exercício 8.5): 


Pr = Pri Prrtplk =D) (pT(k — D)Prb(k =D) +) pT(k— 1)Pkms, 
(8.22) 


e, como antes, o termo a ser invertido será um escalar para modelos com 
apenas uma saída. Finalmente, usando-se a Eq.8.22, a matriz de ganho 
Kk = Py(k — 1), e lembrando que 7 (k — 1)P;-1p(k — 1) é um escalar, 
chega-se a 


H 


9 Prortblk — 1pT(k — 1) Pk-b(k — 1) 
Pav ir Pespk =) + 
ás Pr-tb(k = 1) 
YR DPeablk= D+ 


Kk 


(8.23) 


Colocando-se as Egs. 8.21, 8.22 e 8.23 em ordem apropriada para cálculo 
e observando-se que 1); = W(k—1) (ou seja, o vetor de regressores atualizado 
na iteração k contém informação até o instante k — 1 apenas), obtém-se 


Pratbs 
K=—————; 
E Vi Perbi+ 
de= 0,1 +Ky [ut - vô] ; 18:24) 


Pe = Pr — Ki Pk, 
que é o estimador recursivo de mínimos quadrados (RMQ). Note que a 
semelhança com o algoritmo derivado na seção anterior é grande, sendo 


que a diferença básica está na forma com que a matriz de covariância Pk é 
determinada. 
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8.4 Outros Estimadores Recursivos 


Há uma grande diversidade de algoritmos recursivos que podem ser usa- 
dos para a estimação de parâmetros. Nesta seção serão mencionados os 
estimadores recursivos EMQ e VI, além do estimador para aproximação 
estocástica, 


Seja o modelo ARMAX (ver Eqs. 2.46 e 2.40): 


=ày(k= 1)... ân,y(k = ny) + diu(k = 19 — 1)... 
ot Bnu(k = 14 u) + BE(E — 1)... + ôn E(K — ne) + EK) 
[u(k = 1)...y(k— ny) ulk= 14 = 1)..cu(k = 79 — nu) 
E(k = 1)...E(k — ne)Jô + €(k) 
WT(k — 1) + €(k), 


vík) 


] 


sendo que 74 é o atraso puro de tempo em intervalos de amostragem, Ts, 
e o vetor de regressores p"(k — 1) pode também ser representado por 17. 
Portanto, uma forma de implementar o estimador recursivo estendido de 
mínimos quadrados é a seguinte: 


Kk = Prorbalbk Peorbe + 1]; 


dp = 0: +Kk [o(s - v7ô4-1] ; 
(8.25) 
Pr = Pe — Kb Pk; 


Elk) = y(k) — bRÔs, 


sendo que, na primeira iteração, )k não contém resíduos E(k). A última 
equação no estimador é utilizada para calcular o resíduo na iteração k e 
com ele atualizar o vetor de regressores. 

Analogamente, chamando de zp o vetor de variáveis instrumentais na 
k-êsima iteração, 0 estimador recursivo de variáveis instrumentais pode ser 
implementado como se segue: 
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Mk = Mp1 — Mp2 (1 + VEMe mo VE Mp1; 


Ky = Myzk; 


, : (8.26) 
dp =0,1+Kk [u(s) = vFôs-1] ; 


€() = v(k) — WRôs. 


Deve estar claro que no estimador VI a matriz M não é simétrica e não 
mais corresponde à matriz de covariância cov[0]. 

Nos algoritmos até aqui apresentados, a etapa que exige maior esforço 
computacional é a determinação da matriz de covariância P, ou a matriz 
M, no caso do estimador recursivo VI. Na Seção 8.2.2, pode ser verificado 
que as equações de atualização da matriz de covariância surgem ao se impor 
que o estimador resultante seja de mínima variância. Portanto, se a matriz 
de ganho for Ky £ P;y, O estimador continuará sendo não polarizado, 
porém não será de variância mínima. 

Em casos nos quais as limitações de tempo de computação são críticas 
e quando a propriedade de mínima covariância não for uma necessidade, 
pode-se usar uma matriz de ganho do tipo Kk = Yyp. O resultado é o 
estimador recursivo de aprozimação estocástica 


Ke =Ôbhi 
dk = poa + K [ulh) — 041); (8.27) 


Eh) = u(k) — bFÔ, 


para uma dada seqiiência 7. Se o modelo cujos parâmetros se deseja estimar 
for do tipo ARX, não é necessário usar a última equação em (8.27). Há 
diversas formas de se escolher y,, uma delas é %) = Ck-º;05<a<le 
C uma constante positiva. A única maneira de 8 convergir para um valor 
em regime com covariância zero, ou seja, cov[0,0] = O, é fazer com que 
limp-oo Yk = 0. Por outro lado, quando % tiver valores muito pequenos, a 
taxa de convergência do estimador será baixa. Assim, a escolha de y; deverá 
ser um compromisso entre tempo de convergência e covariância do vetor 
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estimado. Deve ser notado que nas versões recursivas dos algoritmos MQ, 
EMQ e VI, esse compromisso é automaticamente alcançado ao se determinar 
o ganho como sendo Kp = Prbp- 


8.5 Estimação de Parâmetros Variantes no Tempo 


Na Seção 8.3 foi desenvolvida uma versão recursiva do estimador MQ, estu- 
dado no Capítulo 5. Como se sabe (ver Eq. 5.13), o estimador MQ pondera 
de forma idêntica os erros cometidos pelo modelo, em outras palavras, num 
conjunto de dados com N = 1000, a primeira observação tem o mesmo 
peso que a milésima. Quando o sistema não varia no tempo, é razoável, 
em muitos casos (ver a discussão na Seção 5.4.3), atribuir o mesmo peso 
às observações. Entretanto, se o sistema a ser identificado varia no tempo, 
as observações mais recentes precisam ser mais influentes na estimação dos 
parâmetros, uma vez que elas contêm informação mais atualizada. Assim 
sendo, quando o problema em questão é o de estimar os parâmetros de um 
sistema que está variando no tempo, não basta implementar o estimador de 
forma recusiva, mas também é necessário ponderar de maneira diferenciada 
as observações disponíveis. Uma variação dos parâmetros no tempo pode 
ocorrer por uma série de razões, tais como operação do sistema em regiões 
diferentes em que um único modelo linear não seria suficiente, envelheci- 
mento de componentes do sistema, ocorrência de falhas e patologias, entre 
outros. 

O procedimento que será seguido nesta seção na derivação de um algo- 
ritmo recursivo que pondere de maneira diferenciada os valores observados 
será semelhante ao desenvolvimento da Seção 8.3. Uma diferença funda- 
mental será que, em vez de começar com a Eq. 5.45, o ponto de partida será 
a Eq. 5.46. Portanto, 


k -k 


[7 Dus DWG D| Douilk)yli- Duo) (8.28) 
i=l 


j= 
Pr. 


H 


Uma mudança importante na Eq. 8.28 com relação à Eq. 5.46 é a seqiiên- 
cia de pesos w, No caso em batelada, o tamanho do conjunto de dados é 
fixo, N. Assim sendo, o índice do peso unicamente identifica o peso em 
questão, Por exemplo, w37 6 o peso (constante) do trigésimo sétimo resí- 
duo correspondente à trigésima sétima observação. No caso recursivo, por 
outro lado, o peso w37 deverá ser diferente se o último dado recebido foi a 
trigésima sétima observação (nesse caso 137 deverá ser máximo) ou se já 
foram recebidas mil observações (nesse caso w37 será praticamente zero). 


«a 
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Portanto, além do índice, será usado o argumento (dentro dos parênteses) 
para identificar os pesos, Assim, w;(k) é o valor do i-ésimo peso na k-ésima 
iteração (k > 1). 

A sequência de pesos deverá satisfazer as seguintes restrições: 


(6)=1 
( NM = hei) 1h ed 


ou seja, o maior peso sempre corresponde ao último valor recebido e é igual 
a um. Quando um novo dado é recebido, todos os pesos são multiplicados 
por um fator À, que na prática recebe valores na faixa 0,95 < À < 0,99. Vale 
a pena notar que À pode ser variado a cada iteração, nesse caso indicar-se-ia 
As. Outra forma de interpretar o fator À é como sendo a razão entre pesos 
consecutivos para uma mesma massa de dados, ou seja, À = w;-1(k)/w;(k). 
Por essa razão, À é conhecido como o fator de esquecimento. 
A partir da primeira parcela de (8.28), pode-se escrever 


k-1 
Pr = So u(khpli= DbT(i= 1) + uk) (k= Db (k= 1) 


i= 


k-1 
= 5 Milk = Db(i= Db" (i= + b(k= DT(k= 1) 
i=l 
= AP +(k= )yT(k= 1), (8.30) 


sendo que as propriedades (8.29) foram usadas na derivação. A segunda 
parcela de (8.28) resulta em 


Fk 


k-1 
DD uilk)b(i— Du(i) + we(k)b(k= Dyk) 
i= 


AFk 1 + p(k— Dy(h). (8.31) 


" 


Reescrevendo (8.28) e substituindo-se (8.30) e (8.31), chega-se a 


" 


PF 
Pe (AFk= + W(k=— Dy(k)] 
Pi [MPa + W(k= Myth] 


> arts as) 
P | [vt ata] der + y(k— no) 


dai + Poli 0 [u(t) — "(6 Dô] (832) 


ô; 


H 


" 
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Na Eq.8.32 o ganho de adaptação do vetor estimado (muitas vezes re- 
ferido como sendo o ganho de Kalman) é Kk = Ppy(k-— 1). Como feito na 
Seção 8.3, será aplicado o lema da inversão (ver Lema A.4.1) à Eq.8.30, 
fazendo-se A=APÇ4, B=D"=wW(k-1)eC=1, Portanto, chega-se a 


Do = Bet Poty Dpy(k= Deal qt MEME Aa 
E! — Protblk— DT (k= Pe 
cá ; (Pe PRE TR PED) - (889) 
Finalmente, 
Kj = Pap(k-1) 


Lo on Pb IT k= DPeorbh= 1) 

; (mp de=) 
Pr-b(k= 1) 

E RR E 


(8.34) 


Portanto, o estimador recursivo de mínimos quadrados com fator de 
esquecimento À é 


= y Pra 2 
PTP 
dp = 0 +Kk [o(s - v7ô4-1] ; (8.35) 
T 
Pe= | Pais RA 2) ' 
Va Pr p+A 


sendo que o vetor de regressores Wy(k — 1) foi reescrito como hp, uma vez 
que tal vetor é atualizado na iteração k e contém informação até o instante 
k-1, Ou seja, o subíndice indica a iteração, ao passo que o argumento entre 
parênteses indica até que instante se refere a informação contida no vetor. 
É trivial verificar que o algoritmo (8.24) é um caso particular de (8.35), ou 
seja, tais algoritmos são iguais para um fator de esquecimento unitário. 


a 
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Exemplo 8.5.1, Estimação recursiva de ganho e constante de tempo 


Neste exemplo, o estimador (8.35) será usado para estimar recursiva- 
mente o ganho e a constante de tempo de um processo térmico real. O 
processo é bastante simples e consiste basicamente de uma resistência clé- 
trica dentro de uma caixa metálica, sendo que a temperatura externa da 
caixa é medida e armazenada. Semelhantemente, o sinal de entrada de- 
termina o tempo dentro de um período de trabalho em que a resistência 
permanece encrgizada. ? 

Tanto o sinal de temperatura quanto o sinal de comando da resistên- 
cia serão expressos em valores percentuais. À Figura 8.1 mostra dados de 
entrada e saída para um teste realizado em malha aberta. O período de 
amostragem é Tg = 70 segundos. 


o) 
“ E a ai 
” 1 
£w 1 
to | 
de ] 
4 1 
E e 
% 8000 10000] 15000 
(o) 
Gp —— = Sa 
ss 1 
E» 1 
asp E] 
40] + 
as) 1 
% 
a) 5000 10000 15000 


tempo (s) 
FIGURA 8,1; Dados de teste de um processo térmico 


Dados de teste realizado em malha aberta de um processo térmico. 
(a) entrada u(k), razão cíclica, e (b) saída y(k), temperatura, 
(toror O). 


Antes de aplicar o estimador propriamente dito, tanto o sinal de saída 
quanto o de entrada foram alterados de forma a garantir que os respectivos 
valores em estado estacionário antes do teste começar fossem zero. Assim, 
foram subtraídos os seguintes valores dos sinais: 3,3554 de u(k) e 29,6 de 


y(k). Uma vez que se deseja estimar ganho e constante de tempo, utilizou-se 
um modelo de primeira ordem do tipo 


2ApREu, 1993. 
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U(s) ts+1' 


(8.36) 


Mas como o modelo a ser estimado é discreto, utilizou-se a aproximação 
ve [y(k + 1) — y(k)]/Ta, com Ty = Ts para discretizar (8.36), resultando 
em y(k) = ayy(k — 1) + byu(k — 1), sendo que 


8 o 


0 5000 Todos 15000 
tempo (s) 


FIGURA 8.2: Constante de tempo e ganho recursivamente estimados 


Constante de tempo e ganho recursivamente estimados a partir 
dos dados da Figura 8.1. (a) constante de tempo e (b) ganho 
(ermgfe 0). 


A constante de tempo e o ganho estimados na k-ésima iteração são, respec- 
tivamente, 


Deve estar claro que Ky., aqui, representa o ganho do processo e não a ma- 
triz de ganho de Kalman, do estimador recursivo. A Figura 8.2 mostra os 
resultados da estimação recursiva de 7, e Kk obtida, usando o estimador 
(8.35) com A = 0,99. Claramente se observa que a constante de tempo 
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quando o sistema esfria é maior do que quando aquece, uma vez que o 
aquecimento é forçado e o resfriamento é feito por troca de calor (basica- 
mente por convecção) com o meio ambiente. Também, devido ao efeito de 
saturação, 0 ganho do processo é um pouco maior para temperaturas mais 
baixas, conforme pode ser verificado após a aplicação do degrau negativo. 
Se o mesmo conjunto de dados for utilizado para estimar um modelo dis- 
creto em batelada, a constante de tempo do mesmo é de 998s, que, como 
esperado, corresponde a um valor médio. 


| 
| 
| 
5000 10000 15000 


FIGURA 8.3: Efeito do fator de esquecimento 


Efeito do fator de esquecimento na estimação recursiva da cons- 
tante de tempo a partir dos dados da Figura 8.1 (ermgte 0). 


Na Figura 8.2 foi usado um fator de esquecimento igual a À = 0,99. A 
Figura 8.3, por sua vez, mostra valores da constante de tempo estimada 
recursivamente para três valores de À. Para o caso em que o fator de es- 
quecimento é unitário, ou seja, não há esquecimento, o valor de 7 após 
convergência está subestimado (pela Figura 8.1 é possível perceber que no 
resfriamento a constante de tempo dominante do sistema está por volta de 
1100s) além do fato de que a convergência é mais lenta. O melhor resulta- 
do, dentre os mostrados, é o que foi conseguido com A = 0,99, sendo que 
para À = 0,97 o estimador não mais converge. Isso se deve principalmente 
ao fato de que, após um certo tempo, não mais há informação dinâmica nos 
dados, uma vez que o sinal de entrada é um degrau, e a informação útil 
(correspondente à transição de níveis da entrada) começa a ser esquecida. 
Vale a pena notar que antes do estimador começar a divergir, 7, havia 


Digitalizado com CamScanner 


33 8 ESTIMADORES REcCURSIVOS 


rapidamente convergido para um valor praticamente correto, conforme in- 
dicado pela linha pontilhada, a] 


Uma outra forma de permitir que o estimador esteja sempre sensível 
a variações de parâmetros é impedir que a matriz de covariância P,, e 
consequentemente o ganho K4, atinja valores muito pequenos. Uma forma 
de implementar tal mudança no estimador recursivo VI foi proposta por 
Young (1970) e consiste em alterar o estimador (8.26) de forma a se ter 


Mina =M- +D; 

Me = Mie Ma pr-aza [1 + EM prize) PEMapami 

Kipro = Mika; (8.37) 
4 = 041 +Kip [ct - vZô,1] ; 


E(k) = uk) — vis, 


sendo que Mk/k-1, € consequentemente K,j; 1, é 0 valor de M a ser usado 
na iteração k, mas que foi determinado aumentando-se o valor de M da 
iteração anterior. A adição da matriz D garante um valor mínimo para 
os elementos de Mp. À escolha de D é simples e pode tomar por base a 
taxa de variação dos parâmetros, sendo que o ajuste pode ser conseguido 
por experimentação. Além disso, é possível usar ajustes diferenciados para 
cada parâmetro, uma vez que D é uma matriz. 


8.6 Complementos 


Complemento 8.1. Estimação de Matrizes de Estado 


O presente complemento descreve a estimação estocástica de duas ma- 
trizes na representação de estado, a saber: a matriz dinâmica e a matriz 
de entrada. A identificação determinística das quatro matrizes de estado 
foi recentemente revista em (BOTTURA; BARRETO, 2009) e (BARRETO; 
BOTTURA, 2003). 

Considere o modelo discreto linear representado no espaço de estados 


x(k) = bx(k — 1) + Tu(k — 1) + e(h), (8.38) 
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sendo que x(k) = [zi(k) va(k) ... xn(k)J” são os n estados no instante 
k, u(k) = [un(k) u2(k) ... ur(k)J” são as r entradas no instante k = 1 e 
e(k) = [ei(k) ex(k) ... en(k)J" são os valores do erro de regressão para cada 
um dos estados, no instante k. As matrizes na Eq.8.38 têm as seguintes 
dimensões & € IR"*" e T € IR"X", A Eq. 8.38 pode ser reescrita da seguinte 
forma: 


x(h) = [o vibra 
- Atmlh= DE 
st = m(baDA 
o ih ejf alt= 191 pe |- (8.39) 


Tomando-se N aplicações de (8.39), tem-se 


x(1)" m(0) 
“or || ml) 
x(NJT m(N-1) 
dm MA (8.40) 


A Eq.8.40 pode ser resolvida de forma recursiva usando o estimador 
RMQ (8.24), fazendo-se 


Proym(k=1)T 
Ki = 1em(k-1)Pk-im(k=1)T" 
Ay = Àpr + Ki [Xº(h) - m(k = DÃg]; (8.41) 
m(h=1)Tm(k=1)PT 
sf Proim(k=1)Pm(k-1PE, 


Lem(k=1)Pe-im(k=1)T 


Um aspecto importante a observar quando se deseja estimar as matrizes 
de um modelo representado no espaço de estados é que todos os estados 
precisam ser medidos. Assim sendo, a fim de estimar & e T em (8.38) é 
necessário medir n+r variáveis. O algoritmo (8.41) é ilustrado no próximo 
exemplo. 
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Exemplo 8.6.1, Estimação de matrizes de estado 


Neste exemplo os dados serão gerados pelo seguinte modelo em espaço 
de estados: 


0,8 0,1 0,005 
x(k) = [00 07 01 ame 
00 0,0 0,9 
10 0,05 0,0025 
+00 10 005 l|u(k-1)+e(k), (8.42) 
00 00 1,0 


sendo que o vetor de entradas u(k) é composto de três variáveis aleatórias de 
média zero, distribuição gaussiana e variância unitária. Semelhantemente, 
e(k) é também composto de três variáveis com distribuição gaussiana e 
variância tal que resulta numa relação sinal ruído igual a 50dB. A Eq. 8.42 
foi usada para gerar dados para k = 1,...,300, sendo que os primeiros 
duzentos valores foram utilizados para estimar as matrizes de?. O último 
trecho de dados (k = 201,... ,300), por sua vez, foi usado para simular o 
modelo estimado e avaliar seu desempenho. Para isso, foi considerada a 
matriz de observação H = [1 1 1], portanto 


v(k) 
d(k) 


Hx(k) 
H&(k), 


sendo X(k) = dx(k — 1) + Pu(k — 1). A comparação entre y(k) e d(k) é 
mostrada na Figura 8.4. 

Os autovalores do modelo (8.42) são 0,7; 0,8 e 0,9. Os autovalores 
da matriz de estado estimada são eig[6]=(0,6953; 0,8143; 0,8923). Esse 
resultado e a comparação mostrada na Figura 8.4 sugerem que o modelo 
estimado é satisfatório. [nm] 


Complemento 8.2, O Filtro de Kalman 


O Filtro de Kalman, que será estudado em detalhes no Capítulo 9, é um 
conjunto de equações recursivas que são utilizadas para estimar os estados 
de um sistema dinâmico representado pelo seguinte modelo linear no espaço 
de estados (ver Eq. 2.37): 
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Dxpoy + Up + Wp-1 
Hxp-1 + Vk-t (8.43) 


Xk 
Yk-1 


sendo que w e v são variáveis aleatórias independentes que satisfazem as 
seguintes relações ElwywF] = Qk, Elvevk] = Ry e Elvew$] = 0. Com 
o modelo (8.43), dado o vetor de estado no instante k — 1 e os sinais de 
entrada, é possível ter uma estimativa do estado no instante k. Em caso 
de se dispor de uma medição da saída, yk, no instante k, deseja-se obter 
uma estimativa “ótima” do vetor de estado que incorpore a informação em 
y- O filtro de Kalman, portanto, determina tal estimativa que é ótima no 
sentido que minimiza El(%p — xk)”(%k — xk)]. 


10] 


> 
SE 


* 10 20 so 40 50 60 70 so so 100 
número de amostras 


FIGURA 8.4: Desempenho de modelo em espaço de estados 
Saída (—) y(k) e saída estimada (==) f(k) utilizando o modelo 
em espaço de estados (mqstate O). 


Procedendo como na Seção 8.2, chega-se ao Filtro de Kalman 


Ky = 6Pp-16T HT (HOP, TH” + Rg; 
dy = bkpoy + Pupo + Key — H(bês + upoa)]; (8.44) 


Pr =6P,.1d” - Ki HOP, 10”, 
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A segunda equação do algoritmo (8.44) efetua uma correção ao valor 
Xkjk-1 = 9%k-1 + Tup-1 em função do erro cometido pelo modelo para 
determinar %p = %yj;. Em outras palavras, (8.44) estima o vetor de estado 
no instante k usando informação até (e incluindo) o instante k. Esta carac- 
terística, na literatura, distingue filtros de preditores. 

A semelhança entre o filtro de Kalman (8.44) e os algoritmos recursivos 
para estimação de parâmetros apresentados no início do capítulo é grande. 
Para ver isso de forma mais clara, note que y(k) = ”(k — 1)9 + e(k) pode 
ser representado da seguinte maneira: 


0, = 01 
Vk WO + ek, (8.45) 


que corresponde a (8.43) com & = 1, =0,H =; 0, = xp. Aplicando- 
se o filtro de Kalman (8.44) ao modelo (8.45), chega-se a 


Kk = Prorby (WE Pi-rba + RJ; 
dk = 0p-1+Ky [utt) - v7ôs1] ; (8.46) 


Pr = Pe Kiybk Pit 


que é precisamente a versão multivariável de (8.24) com matriz de covari- 
ância de ruído igual a Rk. Em vista disso, não é surpresa que o filtro de 
Kalman seja considerado uma implementação computacionalmente eficiente 
do estimador MQ (SORENSON, 1970). 

Como será detalhado no Capítulo 9, no caso de sistemas não-lineares 
também é possível aplicar os conceitos relativos ao filtro de Kalman, mas 
para isso o algoritmo original (KALMAN, 1960) precisa ser adaptado. 


Leitura Recomendada 


Estimadores recursivos são abordados em praticamente todos os livros sobre 
identificação de sistemas, alguns bons exemplos incluem (NORTON, 1986; 
LJunG, 1987; MENDEL 1987; SODERSTRÔM; STOICA, 1989). O livro por 
van den Bosch e van der Klaw (1994) só trata da identificação em batelada. 
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Por outro lado, Ljung e Sóderstrôm (1983) dedicaram um livro exclusiva- 
mente ao estudo de estimadores recursivos, Apesar da vasta literatura sobre 
o assunto (bem documentada nas bibliografias dos livros acima citados) aqui 
serão mencionados apenas dois. 

O estimador recursivo de aproximação estocástica é descrito por Ljung 
(1977) que também comenta formas de se escolher o parâmetro %y em (8.27). 
Young (1970) discute o estimador VI e apresenta algumas versões para im- 
plementação recursiva. Diversos cuidados a serem tomados no uso de al- 
goritmos recursivos em aplicações em que os parâmetros são variantes no 
tempo foram discutidos em (COELHO; COELHO, 2004; COELHO, 2007). 
Sorenson (1985) compila diversos artigos importantes sobre o desenvolvi- 
mento do filtro de Kalman, bem como trabalhos sobre aplicações dessa 
técnica, e o livro de Mendel (1987) dedica diversos capítulos a problemas 
relacionados ao filtro de Kalman. 


Exercícios 


8.1. Mostre que JElôp-1) + KsEly(k)] = JO + KxElWçÕ:] + KxBlé(k)] 
se y(k) =); 0, + E(k) e se não houver polarização. 


8.2. Derive a Eq.8.8. 


8.3. No desenvolvimento da Eq.8.11, por que foi necessário supor que o 
ruído tem média nula? 


8.4. Derive a Eq.8.12. 

8.5. Derive a Eq. 8.22. 

8.6. Derive a Eq. 8.90. 

8.7. Considere a função de transferência (4,40). Simule esse modelo e use os 
dados resultantes juntamente com o estimador recursivo MQ para estimar 
os parâmetros. 
8.8. Repita o exercício anterior, mas, durante a simulação, altere um dos 
parâmetros da função de transferência (4.40). Use o estimador recursivo MQ 
com fator de esquecimento para estimar os parâmetros. Discuta a influência 


do fator de esquecimento na velocidade de convergência do estimador, bem 
como nos valores para os quais cada parâmetro converge. 
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8.9. Implemente um filtro de Kalman para o sistema do Exemplo 8.6.1 
com H = [11 1), e com ruído de medição em yk. Primeiramente, imple- 
mente o filtro usando o modelo real (8.42) e subsegiientemente use o modelo 
estimado no Exemplo 8.6.1 (mastate 0). 


8.10. Considere o sistema de suspensão apresentado no Exercício 2.11. 
Simule uma falha, como por exemplo um pneu que rasga e que em 15 
segundos se esvazia completamente. Use algum algoritmo recursivo para 
detecção do problema ocorrido no pneu. 


8.11. Considere que na situação do exercício anterior a posição da roda e 
a velocidade da carroceria são medidas. Implemente um filtro de Kalman 
usando: i) o modelo (2.62), e ii) o modelo estimado no exercício anterior, 
logo antes de ocorrer a falha. 
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O Filtro de Kalman 


9.1 Introdução 


Este capítulo trata do filtro de Kalman (KF, do inglês Kalman Filter). 
Como será visto, esse filtro nada mais é do que um estimador recursivo ótimo 
que, em diversos aspectos, assemelha-se àqueles apresentados anteriormente, 
no Capítulo 8. A nomenclatura do Capítulo 8 será levemente modificada no 
presente capítulo, a fim de utilizar terminologia mais comumente empregada 
na área de estimação de estados. 

Assume-se que o sistema sob estudo pode ser descrito pelo seguinte 
modelo linear discreto (ver Eq. 8.43) 


( Xk+1 
Ykm 
sendo que w e V são variáveis aleatórias independentes, de média nula, 
e que satisfazem as seguintes relações Elwew;] = Qu, Elvevi] = Rk é 
Elviw; J=0,Viyj. No contexto de filtragem de Kalman é comum referir-se 
à vesiável w como sendo ruído de processo ou dinâmico (ou, ainda, ruído 
multiplicativo) e v como ruído de medição (ou ruído aditivo). O problema a 
ser estudado neste capítulo consiste em encontrar uma estimativa Xp € IR” 
dado o modelo (9.1), as condições iniciais Xy e sua matrix de covariância 
Po, bem como a segiiência das entradas uy € IR” e as medições yy € IR”. 

Será visto neste capítulo que uma solução ótima ao problema acima é 
fornecida. pelo filtro de Kalman. Esse algoritmo pode ser utilizado para 
estimar os estados de um sistema ou até mesmo estimar estados e também 
parâmetros do modelo (9.1), simultaneamente. Essa característica faz do 
filtro de Kalman um estimador muito utilizado na prática. 


A literatura sobre a teoria e prática do filtro de Kalman é muito ex- 
tensa. Contudo, o objetivo deste capítulo é prover uma introdução sucinta 


Dpxp + Teup + Tuwk 


HeiXkp + Vk+, (1) 
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ao assunto e recomendar ao leitor algumas referências especializadas. Ape- 
sar de ser possível definir-se um filtro de Kalman para sistemas contínuos 
(KaLMAN; Bucy, 1961), neste capítulo somente será abordado o caso dis- 
creto (KALMAN, 1960). Esse estimador será inicialmente descrito nas Se- 
ções 9.2 e 9.3 em sua forma mais simples, seguindo-se a habilidosa exposição 
de Maybeck (1979). 

O algoritmo originalmente proposto por Kalman só se aplica a sistemas 
lineares. Uma maneira de aplicar o filtro de Kalman para tratar sistemas 
não-lincares é lincarizar analiticamente as equações do sistema. Esse pro- 
cedimento veio a ser conhecido como o filtro de Kalman estendido (EKF, 
do inglês Extended Kalman Filter). O EKF será descrito na Seção 9.4. 

Mais recentemente, Julier e colegas propuseram uma alternativa ao 
EKF. Trata-se do filtro de Kalman unscented (UKF, do inglês Unscen- 
ted Kalman Filter), que não requer a linearização analítica das equações 
do sistema e se destaca por usar uma forma mais eficiente para calcular 
a propagação temporal da média e da matriz de covariância dos estados 
do sistema não-linear, que é um componente essencial na determinação do 
ganho de Kalman (JULIER et al. 2000). Como será visto, uma interpre- 
tação do UKF é que tal algoritmo implementa uma lincarização estatística 
(LEFEBVRE et al., 2002), conforme será descrito na Seção 9.5. 


9.2 Conceitos Básicos Relativos ao KF 


O objetivo desta seção é apresentar alguns conceitos básicos que permeiam 
a concepção do filtro de Kalman. Para esse fim, inicialmente será consi- 
derado um exemplo bastante simples e, pouco a pouco, serão introduzidos 
elementos adicionais até chegar a uma estrutura semelhante à do filtro de 
Kalman. Nesse particular, esta seção segue, em linhas gerais, a exposição 
em (MAYBECK, 1979). 


9.2.1 O caso estático 


Suponha que se deseja conhecer a posição, z, de um objeto. Utilizando-se 
um instrumento, obtém-se a medida y, ou seja, y é o valor observado da 
posição z. Se nossa confiança no instrumento e na sua medição for absoluta, 
dizemos que a posição do objeto é y, O que corresponde a considerar x uma 
variável determinística. 

Por outro lado, se nossa confiança no instrumento e na sua medição não 
for absoluta, ou seja, se houver alguma incerteza associada à observação y, 
não seria prudente afirmar que a posição é y. Nesse caso, o melhor seria 
tratar a posição como uma variável aleatória. A maneira de definir variáveis 
aleatórias é por meio de funções de probabilidade. 
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No presente exemplo, em que uma medição da posição do objeto está dis- 
ponível, pode-se pensar em termos da função de densidade de probabilidade 
condicional f(x|y). Essa função quantifica como se distribui a densidade de 
probabilidade de x uma vez conhecida a medição y. Ou seja, dada a medi- 
ção y, qual é a localização mais provável do objeto? Está claro que neste 
exemplo, em que se assume que o objeto está parado, a função f(x|y) é 
característica do processo de medição. Assim, se o instrumento usado para 
medir a posição do objeto for preciso, espera-se que f(z|y) seja estreita. 
Se, além de preciso, o instrumento também for acurado (não-tendencioso 
ou não-polarizado) então f(x|y) estará centrada em torno de z. 


Suponhamos que existam duas medições da posição objeto, yj e y2, obti- 
das por meio de instrumentos com características possivelmente diferentes. 
Nesse caso, faz sentido tentar utilizar ambas as medidas para determinar a 
localização mais provável do objeto. Em termos de função de densidade de 
probabilidade, pode-se definir f(xly1,y2), que é a função de densidade de 
probabilidade condicional de x dadas as medições yj e y2. 


Seguindo-se esse mesmo raciocínio, percebe-se que se houver N medições 


disponíveis y,, y2,-« )YN tem-se uma função de densidade de probabilida- ê 
de condicional de x dadas as medições y; à = 1,...,N, f(z|y,... UN). E 
Uma representação gráfica de uma tal função hipotética é mostrada na 1 
Figura 9.1. O formato e a localização de f(x|y1,... ,yn) dependem do con- me 
junto de medidas y1, Y2,.-. »Yn, razão pela qual utiliza-se a denominação E 
condicional. ' 

Uma observação importante é notar que f(z|y1,... ,yN) é um estima- 8 
dor da posição do objeto, pois, de posse dessa função, é possível estimar um E 
valor ótimo para x. O uso da palavra ótimo implica um critério de otima- 3 
lidade. Por exemplo, se o critério na escolha de x for tal que x seja o valor [3 
mais provável, toma-se a moda de f(z|y1,... »YN), que para a função da a 


Figura 9.1 é um valor em torno de x = 0,4. Na prática, alguns estimadores 
— como o filtro de Kalman — podem ser interpretados como algoritmos que 
implementam uma função de densidade de probabilidade condicional e um 
critério de otimalidade, Portanto, pensar em termos de f(x|y1,... UN) se- 
rá útil ao longo desta seção, em que os conceitos fundamentais relacionados 
ao filtro de Kalman serão revistos, 


Uma das dificuldades de se lidar com funções f(z|yy,... ,Yn) gerais 
é que, em tais casos, são necessários muitos momentos para caracterizar 
f(aly,... Un). Um conjunto de momentos generalizados de w é dado 
por El(z — a)"], em que a e n são constantes. Uma aproximação que se 
faz na prática é considerar que a função f(z|y,... ,YN) é gaussiana, pois 
nesse caso apenas os dois primeiros momentos (média e desvio padrão) são 
suficientes para especificar completamente essa função. 
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0, 
-2 -1 [o] 1 2 3 
x 


Figura 9.1: Função de probabilidade geral 


Função de densidade de probabilidade condicional de x dadas as 
medições y;, à = 1,...,N. No presente caso hipotético, nota-se 
que valores em torno de x = 0,4 são os mais prováveis. O fato de 
f(z|y,... sy) ser bastante dispersa em torno de x = 0,4 indica 
pouca confiança nas medições. 


No desenvolvimento do filtro de Kalman assume-se que as duas fontes 
de erros em (9.1) (a serem definidas em breve) têm distribuições gaussianas. 
É comum utilizar a nomenclatura F » N(Z,0), que indica uma distribuição 
normal, ou seja, gaussiana, com média Z e desvio padrão o. Para o caso de 
um vetor aleatório z € IR”, com média Z e matriz de covariância P € IR"X", 
semidefinida positiva, a função de densidade de probabilidade gaussiana é 
definida como 


fox) = BRRARpAS? (-5m =BJtPfx- n)) (9.2) 
No caso escalar, tem-se 


q 1 * 
fila) = age (-mglt + ah, (9.3) 


em que o é o desvio padrão da variável aleatória escalar 2. 

Retomemos agora o exemplo de tentar determinar a posição de um ob- 
jeto a partir de medições. Suponhamos que tenhamos uma medida y, dessa 
posição e que a incerteza associada a essa medição seja quantificada pelo 
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desvio padrão de 1, o1. Suponhamos ainda que a função de densidade de 
probabilidade condicional seja fi(z|y1), conforme ilustrado na Figura 9.2. 
Nessa figura a função fi(z|y1) é gaussiana com média yj = 0,3 e desvio 
padrão 01 = 0,5. O conhecimento de fi(z|y) sugere que é provável que 
o objeto esteja próximo à posição z = 0,3. Baseado em fi(z|y,) a melhor 
estimativa da posição é Z = y e a variância do erro dessa estimativa é o2. 


A seguir, trocamos o instrumento e fazemos uma segunda medida yp com 
desvio padrão 02. Supondo que fa(z|y2) seja conforme ilustrado na Figu- 
ra 9.2, percebe-se que o segundo instrumento é mais preciso que o primeiro, 
pois 02 < 01. Além disso, o segundo instrumento sugere que a posição do 
objeto deve estar por volta de z = 1, em vez de z = 0,3. Uma possibilidade 
seria, neste ponto, escolher exclusivamente o segundo instrumento e traba- 
lhar simplesmente com £ = ya = 1. Nesse caso, a metade dos dados seria 
desperdiçada. Outra alternativa seria tentar combinar ambas as medições, 
y1 e ya, para chegar a uma medida de compromisso da posição. 


, . + 


lxiyyya) 


(0,74; 0,19) 


hxiy) 
(0,3; 0,5) 


| -0,5 [o] 05 1 1,5 2 
x 


FIGURA 9.2: Funções de probabilidade de uma medição hipotética 


Se ambos os instrumentos tivessem a mesma precisão, é intuitivo to- 
mar a média das medidas feitas como uma estimativa da posição, ou seja, 
£ = 0,6 + 0,942. Mas como os instrumentos têm características distin- 
tas, é razoável dar maior peso àquele instrumento mais preciso. Um desvio 
padrão maior indica menor precisão, portanto, uma forma de ponderar as 
duas medidas é 
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a eds ço (9.4) 
H ojos“ oi+o; e 


em que a última expressão é o desvio padrão do erro da estimativa ótima 
£ = |, em que o subíndice indica que duas medidas foram utilizadas na 
determinação da estimativa. A função de densidade de probabilidade con- 
dicional de 2, dadas as medições y, e y2, está representada na Figura 9.2 
e foi indicada como fa(z]y1,92). O fato de o valor máximo de fa(x|y1, 2) 
estar mais próximo de 1 do que de 0,3 é consegiiência da maior precisão do 
instrumento utilizado para obter 2. Além disso, note queo < cj eo < oz; 
ou seja, a estimativa combinada 2, = |! tem um desvio padrão menor do 
que as estimativas individuais 2 = e £ = yo. Esse ganho é resultante do 
uso de toda a informação disponível. 
A expressão (9.4) pode ser reescrita da seguinte forma 


à = Qutojw+oiw-oin 
oj+o) 
(oi+oB)y + o? (yo =) 
oito; 
= n+K(gp-y), (9.5) 
em que 
Rede à da deká (9.6) 
oi +oi ê 1 E 


Deve ser lembrado que, antes de se tomar a segunda medida, tudo que 
se tinha era y. Ássim, antes de conhecer y2, a estimativa da posição era 
simplesmente % = 1, em que o sub-índice na estimativa significa que ela 
foi obtida utilizando-se apenas a medida y. Usando essa nomenclatura, a 
expressão (9.5) pode ser reescrita como 


do = &+K(y — 2). (9.7) 


A interpretação de (9.7) é que a estimativa 2», que incorpora a informa- 
ção da segunda medida, é igual à primeira medida 2%, = y1 mais um termo 
de correção, que consiste de uma parcela de desvio (y2 — 21) multiplicada 
por um ganho K. A parcela (yo — £1) quantifica a diferença entre a nova 


Digitalizado com CamScanner 


9.2 CONCEITOS Básicos RELATIVOS AO KF 347 


medida recém-tomada e a melhor estimativa da posição, quando da chegada 
da medição y>. Claramente, se a segunda medida fosse idêntica à primeira, 
então (y2 — 21) = O e não haveria necessidade de correção. Portanto, a 
expressão (9.7) fornece um procedimento pelo qual nova informação (vin- 
da em y2) é incorporada à informação disponível a priori (medida y1). Ou 
ainda, em termos das funções de densidade de probabilidade condicional, a 
função fs(x]y1,y2), conhecida como a função de densidade de probablidade 
a posteriori, incorpora a informação em 12, caracterizada por fa(z|y2), à 
função de densidade de probablidade a priori fi(zy1). 

Agora suponhamos que apenas um instrumento esteja disponível e que 
as medidas sejam tomadas ao longo do tempo. Assim, y(ti) indica a me- 
dida feita no instante ty e y(t»), a medida tomada no instante tp. Nes- 
se caso, se as condições em que as medidas são feitas forem equivalentes, 
tem-se que o(t/) = o(t2). Nesse novo contexto as expressões derivadas 
até aqui permanecem válidas, mas será conveniente chamar fa(z|y1,y2) de 
F(x(to)ly(ti), y(ta)) indicando que se trata da função de densidade de pro- 
babilidade da posição no instante ta, z(t2), dadas as medidas tomadas nos 
instantes t; e to. A média e a variância de f(z(to)Jy(ti), y(ta)) são dadas 
respectivamente por (9.7) e (9.6) que, feitos os devidos ajustes na nomen- 
clatura, transformam-se em 


Eta) = &(th) + K(to)ly(ta) — &(t1)), (9.8) 
ct) 
o2(tr) + 02(ta) 


ot) = ot) K(to)o2(t). (9.9) 


Em função disso, é comum dizer que as expressões (9.8) e (9.9) propagam 
a função de densidade de probabilidade condicional do instante de tempo 
t; para o instante de tempo tz, conforme ilustrado na Figura 9.3, em que 
a primeira medição é tomada no instante t; e a segunda no instante ta. 
Considera-se que as medidas foram feitas com o mesmo instrumento e nas 
mesmas condições. Portanto, as funções de probabilidade f(z(t)|y(t1)) 
e f(x(t>)ly(tz)) são iguais. Ao incorporar-se a informação disponível na 
medida y(t>), tem-se a função f(z(t»)|y(ti), y(ta)). 

Para encerrar esta primeira discussão, ainda faremos mais um ajuste à 
nomenclatura (visando aproximar-nos à nomenclatura usualmente utilizada 
no contexto do KF). Em tj a estimativa de posição é simplesmente &(ti). 
Como essa estimativa é baseada exclusivamente na informação disponível 
no instante ti, usaremos a seguinte notação 2(t,|t1), indicando que se tra- 
ta da posição x no instante t; estimada com informação disponível até o 


Digitalizado com CamScanner 


348 90 Pirro DE KALMAN 


instante tj. No instante ty, antes de considerar a nova medição y(tz), a 
estimativa da posição continua sendo o mesmo valor, pois considera-se que 
o objeto está imóvel, assim &(ta]ti) = (til) e o(tati) = o(tilti). Mas 
utilizando-se (9.8) é possível corrigir o valor estimado incorporando-se a no- 
va medição y(t»), nesse caso tem-se a nova estimativa 2(t2|tz), que € o valor 
estimado da posição no instante tg utilizando-se as duas fontes de informa- 
ção disponíveis até o instante ta. Essas fontes de informação são Z(t2|ty) e 
ut»). Reescrevendo as expressões (9.8) e (9.9) com essa nova nomenclatura 
chega-se a 


ê(tolto) = ltolty) + K(ta) [u(ta) — E(talti)) (9.10) 
o2(tolti) 
Ho) = cai) oito)" 
iai o2(talto) = 02(talta) — K(ta) o?(talti). (9.11) 


Led t 


FIGURA 9.3: Propagação da função de probabilidade, caso estático 


A primeira medição é tomada no instante t, e a segunda no instan- 
te ta. As respectivas funções de probabilidade estão indicadas con 
linha cheia e linha tracejada, Considera-se que o objeto está esta- 
cionário entre t; e ta, razão pela qual as funções pontilhadas são 
idênticas à função em ti, que é igual à função em ta. Levando-se 
em consideração ambas as medidas, obtém-se uma função densi- 
dade de probabilidade condicional f(z(ta)|y(ti), y(ta)) em tz, in- 
dicada com linha traço-ponto. Diz-se que essa função é a propa- 
gação de f(x(ti)|y(ti)) até o instante to, quando nova informação 
é levada em conta. 
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Assim, as Eqs. 9.10 e 9.11 podem ser vistas como o resultado da fusão de 
duas fontes de informação. Antes da chegada da medição em tz a informação 
era representada por uma função densidade de probabilidade gaussiana com 
média &(ta]ti) e variância o?(ta|t1). Por outro lado, a medição é vista como 
uma realização tomada de um processo gaussiano com função de densidade 
de probabilidade com média y(ta) e variância o2(ta). A fusão dessas duas 
fontes de informação resulta em uma função de densidade de probabilidade 
gaussiana com média Z(tz]ta), dada por (9.10), e variância o2(talta), dada 
por (9.11). 


9.2.2 O caso dinâmico 


No caso estático foi considerado que o objeto observado não se movia entre 
os instantes ty e tg. Conseqiientemente, não havia nenhuma razão para 
alterar a estimativa de sua posição em ty antes de chegar a nova medição, 
ou seja, considerou-se &(ta]t1) = Z(ti|ty) e o(talti) = o(tilti). Entretanto, 
se o objeto se movesse de acordo com alguma lei — por exemplo & = v, 
sendo v uma velocidade constante — faria sentido utilizar essa lei para 
propagar a informação da posição em ty para tz antes de receber a nova 
medição y(ta). 

Para facilitar, tomemos a aproximação de Euler da derivada e incluamos 
um termo aleatório na lei que descreve o movimento do objeto, ou seja, 


e(ta) — et) 
to-t 
z(ta) 


v-+w(ta) 
e(ti) + (to — to) fo + w(ta)), (9.12) 


em que w(t) é uma variável aleatória que quantifica a incerteza ao determi- 
nar a posição no instante t utilizando-se (9.12) e assume-se que tal variável é 
branca e w(t) » N(0,0u). Em outras palavras, w(t) quantifica incerteza na 
equação dinâmica que descreve o sistema (no presente exemplo a equação é 
= v), sendo que comumente refere-se a essa variável como ruído dinâmico 
ou ruído multiplicativo. 

De posse de (9.12) é possível estimar a nova posição do objeto no instante 
t>, com conhecimento apenas de sua posição estimada em t, e da lei que 
descreve esse movimento, ou seja, Z = v. Nesse caso pode-se escrever: 


(talt) = E(tilty) + (ta — ta)o 
(9.13) 
o?(talth) = 02(tilty) + (ta — ta)od. 


Deve ficar claro que o que tornou possível escrever (9.13), em vez de 
simplesmente 2(talti) = Z(tilti) e o(talti) = o(tilti), como aconteceu no 
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caso estático, é o fato de se ter uma lei que descreve o movimento do objeto, 
ou seja, a lei (9.12). 


O conjunto de equações (9.13) fornece a melhor predição da posição no 
instante to sem levar em conta a nova medição que chega nesse instante, 
Em outras palavras, a melhor estimativa da posição no instante tg usando-se 
a informação disponível em ty mais o conhecimento da lei de movimento é 
*(to!h) com variância o2(to|ti). Note-se que o?(talti) > o2(tilt1) porque a 
incerteza associada à lei do movimento, quantificada por ow, é responsável 
por aumentar a incerteza associada à medição, à medida que o tempo passa. 


Finalmente, no instante ty chega a nova medição y(tz) com variância 
o?(t) e deseja-se aproveitar essa informação adicional para melhorar a es- 
timativa fornecida por (9.13). Como visto anteriormente isso pode ser feito 
utilizando-se as expressões (9.10) e (9.11), que foram desenvolvidas para in- 
corporar a informação oriunda de uma nova medição. Vale mencionar que a 
variância o?(to) do processo de medição pode ser interpretada como sendo 
uma consegiiência de ruído de medição ou ruído aditivo. Portanto, é comum 
dizer que o filtro de Kalman considera duas fontes de ruído independentes 
e com distribuição gaussiana: o ruído dinâmico (ver discussão logo depois 
da Eq.9.12) e o ruído de medição. 


A informação presente na nova medição é usada (ver segunda parcela 
do lado direito da Eq.9.10) para ajustar valor da posição propagado pela 
lei de movimento, ou seja, Z(ta]t1). Por outro lado, com a chegada da nova 
medição, a Eg.9.11 reduz a incerteza associada à nova estimativa, graças 
à nova informação. Isso revela a estrutura do tipo predição-correção do 
presente algoritmo, pois com o conhecimento da lei de movimento é possível 
fazer a predição (ver Eg.9.13) e com a chegada de uma nova medida efetua- 
se a correção (ver Eq.9.10). Portanto, as equações de correção (9.10) e 
(9.11) são as mesmas tanto para o caso estático como para o dinâmico. 
A diferença está na etapa de predição, que só existe no caso dinâmico e é 
efetuada por meio de um modelo dinâmico necessário à implementação do 
filtro de Kalman. Esse procedimento está esquematicamente representado 
na Figura 9.4. 


A consistência das equações discutidas nesta seção pode ser verificada 
considerando-se alguns casos particulares, Primeiramente, suponha que a 
medição seja muito ruidosa. Isso significa que há pouca confiança na nova 
medição e espera-se que a mesma não influa significativamente no próximo 
valor de saída do filtro. Matematicamente, esse cenário é representado 
por o2(ty) grande e, conseqientemente, K(ta) pequeno. Como K(t,) é 
pequeno, a nova medida y(tz), de fato, influirá pouco na nova saída ?(ta]t2), 
conforme pode ser constatado da Eq. 9.10, Nesse caso, a saída é fortemente 
influenciada por Z(t2]t1), que, no caso dinâmico, é a saída do modelo. 
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FIGURA 9.4: Propagação da função de probabilidade, caso dinâmico 


A primeira medição é tomada no instante t; e a segunda no ins- 
tante ta. As respectivas funções de probabilidade estão indicadas 
con linha cheia. A função densidade de probabilidade condicional 
Fa(to)|y(t), y(ta)) em ta, (última curva indicada com linha pon- 
tilhada), leva em conta não apenas a medição em ta, mas também 
a função de densidade de probabilidade em ty propagada para o 
instante ta. 


Considere-se um outro cenário, mas agora a grande fonte de incerteza 
é o modelo dinâmico utilizado na implementação do filtro. Intuitivamente 
percebe-se que o ideal seria que a medição tivesse maior peso na determi- 
nação da saída do filtro do que o modelo. Matematicamente, isso pode ser 
visto considerando que se há pouca confiança no modelo, então o?(talti) é 
grande e, consegiientemente, K(t») — 1, o que permite reescrever a Eq. 9.10 
como Z(to|ta) = y(ta), como antevisto pela avaliação intuitiva. 

Ao encerrar esta introdução ao filtro de Kalman, chama-se a atenção 
para o fato de que se o modelo utilizado na implementação do filtro for 
contínuo, será necessário utilizar técnicas de integração numérica a fim de 
propagar os estados ou a saída do sistema, via modelo. Em razão disso, no 
restante do capítulo apenas o caso em tempo discreto será considerado. 


9.3 O Filtro de Kalman Discreto 


O filtro de Kalman pode ser derivado de diversas maneiras, Nesta se- 
ção esse algoritmo será derivado seguindo um procedimento, detalhado em 
(CRASSIDIS; JUNKINS, 2004), que se assemelha àquele seguido na Seção 8.2. 
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Uma dedução do filtro de Kalman baseada na teoria de Bayes pode ser en- 
contrada em (MAYBECK, 1979). 

O ponto de partida é perceber que se trata da estimação de estados de 
um sistema dinâmico para o qual há uma lei de “movimento” conhecida, a 
saber, o modelo (9.1). Portanto, a etapa de propagação do vetor de estados 
estimado será realizada da seguinte maneira (compare com a Eq. 9.13 e veja 
a Figura 9.4) 


X(talty) = (ti) (tita) + Pltiu(t). (9.14) 


A fim de tornar a nomenclatura um pouco mais geral, o intante ty se- 
rá substituído pela iteração atual, indicada por k, e o instante ta, pela 
próxima iteração, indicada por k + 1. Além disso, a notação (t|ti) será 
omitida utilizando-se, em seu lugar, um sinal +" para indicar que a gran- 
deza refere-se ao instante t; após ter sido incluída a informação chegada em 
ti. Analogamente, será utilizado um sinal *=" para indicar que a grandeza 
refere-se ao instante t; antes de ter sido incluída informação referente àquele 
instante. Portanto, a Eq.9.14 passará a ser escrita como 


Xe = das + Peup. (9.15) 


Um ponto que precisa ser notado com respeito ao modelo (9.1), e que 
também pode ser notado na Eq.9.15, é que suas matrizes (dp, Pk, Tk € 
Hy1) têm subíndices. No caso de modelos lineares invariantes no tempo, 
tais matrizes são constantes e, portanto, dispensam o uso de subíndices. 
Contudo, em vista da possibilidade de tratar sistemas variantes no tempo, 
sistemas não-lineares linearizados ao longo do tempo, e de modelos em que 
alguns parâmetros também são estimados pelo filtro, é comum usar a no- 
tação mais geral que permite trabalhar com matrizes do modelo dinâmico 
que podem variar de uma iteração para a seguinte. 

A menos dos sinais '+ e *—?, o leitor certamente reconheceu que (9.15) é 
simplesmente um modelo discreto linear, representado no espaço de estados, 
que propaga o estado na iteração k para a seguinte iteração, conhecendo os 
sinais exógenos (entradas de controle) em up. O detalhe dos sinais, como 
discutido no parágrafo anterior, refere-se ao fato de que a grandeza com '—* 
foi obtida apenas pela propagação do último valor estimado do estado, EO 
Com a chegada da nova medição na iteração k + 1 será possível corrigir a 
estimativa propagada, levando-se em consideração a nova informação. Para 
esse fim, como visto anteriormente, pode-se utilizar (9.10), que, utilizando 
a nova nomenclatura, pode ser reescrita como 


&ia = & +Kken [ven — Hinça) (9.16) 
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em que yk+1 é a medição referente ao instante k + 1 e Hp 1%, 60 valor 
esperado para a saída do modelo nesse instante, utilizando informação até 
o instante k. Portanto, as etapas de propagação e de correção no filtro de 
Kalman serão realizadas, respectivamente, por (9.15) e (9.16). 

Voltemos a pensar em termos de funções de densidade de probabilidade. 
Suponhamos que na iteração k o estado de um modelo linear estocástico se- 
ja caracterizado por uma função de probabilidade fy » N(X%y,Pk), em que 
x é a média, e Pk é a matriz de covariância. Uma importante pergunta 
é: qual será a função de densidade de probabilidade na próxima iteração, 
fk+1? Antes de tentar responder a essa pergunta, é necessário observar que 
no instante k + 1 há duas funções de densidade de probabilidade de inte- 
resse, uma relacionada a j,, (ver Eq.9.15) e outra a ES (ver Eq. 9.16). 
Trataremos cada caso em seqiiência. 


9.3.1 A etapa de propagação 


Dada a função de densidade de probabilidade de x; que será indicada por 
fee Ni (REP ), deseja-se encontrar a função de densidade de probabilida- 
de de xy,,. Em outras palavras, deseja-se saber o que acontece a fk ao ser 
propagada pela Eq. 9.15. 

Um resultado básico de processos estocásticos é que uma função de den- 
sidade de probabilidade gaussiana permanece gaussiana ao ser propagada 
por um sistema linear (ver Exercício 9.1). Por esse resultado, sabe-se que, 
como fk é gaussiana por hipótese, então f- também será gaussiana, ou 
seja, f- N(RpenPen) Portanto, basta determinar %,,, e P;,, para 
caracterizar f.. completamente. 

Para esse fim, o primeiro passo é tomar o estado xi e substituí-lo na 
primeira equação em (9.1) 


xp = Dexj + Tur + Tewks (9.17) 


em que o uso de *+ e *—' segue a convenção adotada na Eq. 9.15. 

Assumindo ergodicidade (o que permite substituir o valor esperado pe- 
la média temporal); lembrando que, por ser um sinal exógeno conhecido, 
uy é determinístico e, por hipótese, a média do ruído dinâmico é nula, a 
esperança matemática de x,,, em (9.17) é dada por 


Xen = DR +Tyup. (9.18) 


Portanto, (9.18) fornece a média de f-., que é a função de densidade de 
probabilidade após a propagação do vetor de estado pelo modelo dinâmico 
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linear. Comparando-se (9.18) e (9.15), nota-se que são equivalentes se a 
estimativa escolhida for o valor médio. De fato, por se tratar de distribuições 
gaussianas, praticamente qualquer critério de otimalidade na estimação do 
vetor x resultará no seu valor médio. 

Resta ainda determinar uma expressão para a matriz de covariância. 
Inicialmente define-se o erro de estimação na etapa de propagação (antes 
da correção) como sendo 


Xp = Rpm Xket (9.19) 
em que o tilde indica o erro, o chapéu indica o valor estimado e xp +, é O 


valor real do vetor de estado. Substituindo (9.15) e (9.1) no lado direito de 
(9.19) resulta em 


[Dez + Teus) — [baxa + Deus + Tuws) 
Dylkk — x4) = Tawa 
Dako — Tewk (9.20) 


Xp 


Portanto, a matriz de covariância de x, é dada por (ver Definição C.1.3) 


Poa = EK — Eliaç — Elia] 
Elk % xs = xk+1)"] 
Elk (%k 4)", (9.21) 


] 


em que se supôs que a estimativa Xp, não é polarizada. À expressão (9.21) 
mostra que a matriz de covariância do vetor de estado estimado é igual à 
matriz de covariância do erro de estimação, para o caso não polarizado, para 
o qual Elkç,1] = 0. Substituindo (9.20) em (9.21), chega-se a 


Pon = El(daxy — Tuwe)(Bex — Lews)"] 
= Eldaxj (XE )T DA] — ElBeXE wa Th] 
—E[ewa(Xj)" DF] + BlCewewE TE] 
= PROF — Dr EfRE WE) TE — TkElwa(X; E + TkQRTR 
= 4Pp O, + TEQTE, (922) | 


em que Elkfwr] = Elwk(X;)"] = 0, pois o vetor de erro na iteração k 
não está correlacionado com o erro de estimação na mesma iteração (ver 
Exercício 9.2). 
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Com esse desenvolvimento chegamos ao final do primeiro objetivo, que 
era o de caracterizar f. » N(%pPky1). Assim Xp, é fornecido pela 
Eq.9.18 e Pç, é dado pela Eq.9.22. 


9.3.2 A etapa de correção 


Como observado anteriormente, o procedimento de filtragem é composto de 
duas etapas. Primeiramente, o vetor de estado x; é propagado para a pró- 
xima iteração, resultando em Xe Tal propagação é realizada utilizando-se 
o modelo dinâmico, que descreve como é que o vetor de estado muda de uma 
iteração para a seguinte. A segunda etapa, a de correção, occore com a che- 
gada de nova informação (medição) na iteração k + 1. Utilizando essa nova 
informação é possível corrigir o vetor de estados disponível previamente à 
chegada da medição, x;,,, para dar origem ao vetor de estado corrigido 
(definitivo), Xin Como visto, essa correção é realizada utilizando-se a 
expressão (9.16). 

Na subseção anterior encontramos a distribuição de probabilidade de 
xp S=  N(%p Pk): Na presente seção, deseja-se saber o que acon- 
tece a f- ao ser operada a etapa de correção, ou seja, deseja-se caracterizar 
a distribuição de xj.,,, que será indicada por fp = NPR). 

Assim, o objetivo acima pode ser descrito como a determinação da dis- 
tribuição a posteriori, fy » N(Xf,11Pk,1), à partir da distribuição a priori, 
E BM NPR)» e da medição que chega nessa iteração, yp,1. Com 
respeito ao valor médio de f,, a própria equação de correção, Eq. 9.16, des- 
creve como valores são corrigidos. Portanto, é possível relacionar as médias 
de f, e de f. por 


Kia = %e + Ken [ye — Hen]. (9.23) 


A fim de encontrar uma expressão para a matrix de covariância Pf 1, 
como antes, será definido o erro de estimação após a correção como 


&in = ku — Xk+ (9.24) 
Assim, a matriz de covariância desejada é (compare com a Eq,9,21) 


Pi 


= Ebia(afa). (9.25) 


Substituindo (9.16) no lado direito de (9.24), tem-se 


Kia = Ret Kit [ya — Hip] — Xe (9.26) 
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Utilizando a segunda equação de (9.1), a Eq.9.26 pode ser reescrita como 


So 8a t Rea Max viga = Mika) — Xen 
o Rea) — (1 = Ka Mexa + Mk Vh 
(= Rea) dt Ke Vis (9.27) 


sendo que a definição (9.24) foi utilizada na última passagem. Substituindo 
(9.27) em (9.25), obtém-se 


Ph = EMI=KI) (O) (= KH)" + E(I = KI VT KT] 
+ELKV(R)(I — KH)"] + BK vv" Ke] 
= (I-KH)P-(I=KH)" +(1- KH)Epo vTKT 
+KEIv(K = KH)" + KRKT 
= (I-KH)P-(1-KHJ +KRK”, (9.28) 


em que os subíndices k + 1 do lado direito da equação foram omitidos para 
meior clareza. Na obtenção de (9.28) utilizou-se o fato de Elke VA. 1]=0 
e de Elve.1(X7,1)"] = 0, uma vez que o ruído de medição em uma iteração 
não está correlacionado ao erro da estimação corrigida naquela iteração 
(ver Exercício 9.3). Portanto, a função de distribuição de probabilidade 
de interesse, f, » N(X,1Pk,1), é caracterizada pelas expressões (9.23) e 
(9.28). No que se segue, buscar-se-á uma expressão análoga à Eq. 9.28, mas 
que não dependa explicitamente de Ky,1. 

À semelhança do que foi feito na Seção 8.2, a matriz Kk+1 será deter- 
minada resolvendo-se um problema de minimização, No presente desenvol- 
vimento deseja-se minimizar o traço da matriz ART que é equivalente a 
minimizar o somatório dos quadrados dos erros de estimação Xf,,. Mate- 
maticamente, o problema a ser resolvido agora é 


min Tr(P$,). 
Kim 


Portanto, utilizando a expressão (A.6), tem-se 


7 + 
ni =0=-21-KH)P- HT" +2KR, (9.29) 
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em que foi utilizado o fato de que as matrizes P- e R são simétricas, por 
construção (ver Exercício 9.4), e os subíndices, k + 1, foram omitidos. Re- 
solvendo (9.29) para K resulta em 


K=P-HIHP-H'+R/), (9.30) 


Expandindo a expressão (9.28), obtém-se 


Pt=P--P-HTKT-KHP +K(HP HT+R)K”, (9.31) 


Substituindo a expressão (9.30) no elemento sublinhado em (9.31) re- 
sulta em (ver Exercício 9.5) 


Pt = P--KHP”, (9.32) 
ou (voltando a indicar os subíndices) 


Pin = Pen Pon He (Hen Pr Her + Re] Hen Pe (9.33) 


em que a expressão (9.30) foi utilizada. Assim, (9.23) e (9.33) caracterizam 
a distribuição a posteriori, fp e N (ElrasPRça). Um aspecto interessante 
revelado por (9.32) é que a incerteza da distribuição a posteriori é menor 
do que a da distribuição a priori. Essa redução na matriz de covariância 
deve-se ao uso da informação adicional oriunda da medição no instante k+1. 

Chama-se a atenção do leitor para a semelhança que existe entre o de- 
senvolvimento apresentado nesta seção e aquele da Seção 8.2, por exemplo, 
compare (8.11) com (9.28). 


9.3.3 As equações do filtro de Kalman discreto 


O filtro de Kalman, portanto, é a fusão das duas etapas anteriormente vistas: 
a etapa de propagação e a de correção. Isso confere ao filtro de Kalman o 
que veio a ser conhecido como a estrutura preditora-corretora. 

Uma seqiiência de cálculo do filtro de Kalman seria (considerando co- 
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Ki = DR + Teu; (Eq. 9.15) 

Pra = PEPPDE + TEQTE; (Eq. 9.22) 

Ken = PrHRAlH Pen HE + Ren]! (Eq. 9.30) (9.34) 
Kb = Kg + Kia [yes — Hera]; (Eq. 9.16) 

Pra = Pp — KnHenPç aa 


É instrutivo notar que a relação entre a nomenclatura utilizada até aqui 
com outra, também muito empregada no contexto do filtro de Kalman, é 


xi = + AP; xi, =x (+ Mk + 1) 
(9.35) 
Pu = P(A: Pó = PlR A | +). 


É possível reescrever o conjunto de equações (9.94), substitui-se (9.15) 
em (9.16), utiliza-se (9.90) e substitui-se (9.92) em (9.22), resultando em 


Ra = Dat + Dt + Dea [y — Ha]; 
Ky = PeE(He PME + RaJ!; : (9.36) 


Pyn= De PidE — De Ke H Ped + TT; 


em que a última equação de (9.36) é conhecida como a a equação de Riccati 
discreta. É interessante observar que o algoritmo (9.36), na sua primeira 
equação, efetua tanto a etapa de propagação, quanto de correção. Contudo, 
a parcela de correção é feita com a medida da iteração anterior (note yk). 
Isso torna o algorimo (9.36) um preditor de Kalman, em vez de um filtro 
de Kalman. 

A prática da filtragem de Kalman, como em tantos outros casos, tem 
suas sutilezas, tais como formas de fatoração matricial numericamente mais 
adequadas, questões de inicialização, dentre outras. Alguns desses aspec- 
tos e diversos conselhos de ordem prática podem ser econtrados em (RIOS 
Nero; HEMERLY, 2007). 


Estimação conjunta de estados e parâmetros 


O filtro de Kalman pode ser utilizado para estimar simultaneamente tanto 
estados, como parâmetros. Para esse fim, é necessário supor que a variação 
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de parâmetros é nula ou muito mais lenta do que a variação dos estados. Tal 
suposição permite eliminar a necessidade de um modelo para a propagação 
de parâmetros, Portanto, na etapa de propagação de parâmetros assume-se 
simplesmente que 0,41 = 0p + pk (compare com Eq.8.45), em que py é 
uma variável aleatória com distribuição gaussiana, não correlacionada com 
va. Assim, a etapa de propagação se dá de acordo com 


[83] = [SERES] em 


ko = Sp +aL 


em que o + indica as grandezas aumentadas, em função da inclusão de 
parâmetros no vetor a estimar. Detalhes de implementação serão discutidos 
mais adiante neste capítulo. 


9.4 O Filtro de Kalman Estendido 


O desenvolvimento do filtro de Kalman, mostrado na Seção 9.3, assumia 
que o sistema era linear. Consegientemente, o modelo utilizado para pro- 
pagar o vetor de estado era linear (ver Eq.9.1). Entretanto, a conseqiiência 
prática mais relevante de se considerar o sistema linear é considerar que a 
distribuição de densidade de probabilidade depois da propagação f.. é gaus- 
siana, uma vez que as variáveis aleatórias w e v também são, por hipótese, 
gaussianas. 

No caso não-linear, nem a propagação pode ser feita por um único mo- 
delo linear, nem é realista considerar que a f- seja gaussiana. Desde que 
se conheça o modelo não-linear do sistema, propagar 0 vetor de estado po- 
de ser facilmente realizado utilizando-se tal modelo. Portanto, a menos de 
algum pequeno acréscimo de complexidade nos cálculos, propagar o vetor 
de estado não é um problema no caso não-linear, Entretanto, como f.. não 
mais é gaussiana, não é razoável imaginar que (9.22) descreva a covariância 
de f... Além disso, ainda que houvesse uma expressão para tal covariância, 
como f.. não é gaussiana, seria necessário outros momentos, além da média 
e covariância para descrevê-la. 

Uma solução “clássica” para esse problema, que passou a ser conheci- 
da como o filtro de Kalman estendido (EKF, do inglês Ertended Kalman 
Filter), consiste de linearizar analiticamente o sistema em torno do atual 
estado e aplicar as equações do filtro de Kalman (JAZWINSKI, 1970). Isso 
será detalhado a seguir, 

Será considerado que o sistema é não-linear e pode ser descrito por 
(compare com a Eq.9.1) 
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xr = f(xpUp, Wk), 
9.38 
( yr = h(xkr) + Vk+t 19:88) 


em que f e h são as funções não-lineares do sistema (processo) e de obser- 
vação, respectivamente. Deve estar claro que, conhecidas essas funções, o 
modelo (9.38) pode ser utilizado facilmente para propagar, tanto o vetor 
de estado x, quanto o vetor de saída y. Como mencionado anteriormen- 
te, o problema é que no caso não-linear não há expressões fechadas para 
determinar as matrizes de covariância associadas. 

O filtro de Kalman estendido (EKF) é o próprio filtro de Kalman im- 
plementado utilizando as matrizes jacobianas de f e h, ou seja, utilizando 
as linearizações (primeiros termos na expansão da série de Taylor) de tais 
funções. 

Como f e h podem ser funções vetoriais, indicaremos por fi a i-ésima 
componente de f. Portanto, a matriz jacobiana de f é definida como 


dm Bh e de 


DiG)=| : Pa ts 
de o da 


(9.39) 


sendo que uma matriz análoga, mas com respeito ao vetor de ruído de 
processo, w, é definida como 


Sha Bla o dl) 


Df(w) = (9.40) 


A matriz jacobiana de h é definida de maneira análoga. Deve estar claro 
que, ao contrário do que acontece em sistemas lineares, para sistemas não- 
lineares a matriz jacobiana Df(x) não é constante. Entretanto, se Df(x) 
e Dh(x) forem avaliadas em valores específicos do vetor de estado, x = xo, | 
as respectivas matrizes jacobianas passam a ser constantes. Nesse caso, a | 
interpretação é que Df(xo) e Dh(xo) são as linearizações de f e h em torno 
de x = Xo. 
Procedendo dessa maneira, o filtro de Kalman estendido, no caso dis- 
creto, pode ser escrito como 


Digitalizado com CamScanner 


9.5 O Fiirro DE KALMAN Unscented 361 


Re = (kun); 
Pç = Df(xi) PEDI (E) + DJ (wi) QRDI (wa )”; 
Kiki = Pr Dla(oxy ) [Dep ) Dl) + 
(9.41) 
+Dh(xy+1) Rea Diap) T] 
XE = Rpg + Kia [kt — hr); 
Ph = Pr — KeDh(k+1) Pr 


em que as matrizes jacobianas são avaliadas da seguinte maneira 


Dil) = DICK) =(8f, 04,0) 
Df(w:) = Df(we)es=(8 04,0) 
Dh(xy+1) = Dh(xk+1) estro” 


Deve ser notado como no EKF as funções não-lineares f e h são uti- 
lizadas, respectivamente, na primeira equação de (9.41) — propagação do 
vetor de estado — e na quarta equação de (9.41), para determinar a saída 
esperada, dado o vetor de estado propagado e a fução h. Nas demais equa- 
ções as matrizes jacobianas de f e de h foram utilizadas para determinar 
as matrizes de covariância e o ganho de Kalman. 

É importante notar que a primeira equação em (9.41) pode ser reescrita 
como %j,, = f(E[Kf), us),! que é uma aprozimação do que deveria ser 
idealmente calculado, ou seja, %p,, = Elf(%j x). 


9.5 O Filtro de Kalman Unscented 


O filtro de Kalman unscented (UKF, do inglês Unscented Kalman Filter) 
baseia-se em uma transformação, que foi denominada de transformação uns- 
cented, e que será apresentada na Seção 9.5.1, 

Chamemos de x e y dois vetores de variáveis aleatórias, que são rela- 
cionadas por uma função não-linear f, tal que y = f(x). Se for possível 
obter um número suficientemente grande de realizações de x e y, então as 
suas médias amostrais X e y poderiam ser calculadas, bem como as matri- 
zes de covariância (amostral). Deve ser notado que tais entidades podem 


iNo caso em que não há polarização, %f = Efx4]. 
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ser calculadas utilizando-se as definições, mesmo sem o conhecimento da 
função f. 

No contexto de filtragem de Kalman para sistemas não-lincares, foi visto 
na última seção que a maior dificuldade era que não há expressões mate- 
máticas para determinar a matriz de covariância a posteriori. A solução 
implementada pelo EKF foi a de lincarizar o sistema em torno de uma esti- 
mativa do vetor de estado e lançar mão das expressões disponíveis para as 
matrizes de covariância de sistemas lineares. 

Uma possível solução no caso não-linear seria, então, tomar um grande 
número de realizações de x e propagá-las usando a função f para se obter 
o mesmo número de realizações de y. Agora, em vez de tentar derivar uma 
expressão fechada que descreva a matriz de covariância de y em termos 
da matriz de covariância de x e da função f, como tem-se as realizações 
de x ey, as referidas matrizes podem ser determinadas numericamente, 
utilizando-se as definições de covariância. 

Uma dificuldade de ordem prática com esse procedimento é que um 
grande número de realizações de x e y precisam ser manipuladas a cada 
iteração do filtro para determinar a matriz de covariância da função de 
densidade de probabilidade a posteriori. 

Uma solução a esse problema foi proposto por Julier e Uhlmann, em 
1994. A idéia básica é escolher poucas realizações de x e y, mas realizações 
que sejam representativas no sentido de que não haverá grande diferença 
entre as matrizes de covariância amostral calculadas a partir dessas poucas 
realizações, quando comparadas àquelas calculadas com um grande número 
de realizações. À cuidadosa escolha de tais realizações representativas, bem 
como a formulação resultante, vieram a ser conhecidas como a transforma- 
ção unscented, a ser descrita a seguir. Antes, porém, deve ser dito que, 
pelo fato das funções de densidade de probabilidade envolvidas não serem 
(em geral) gaussianas, a fim de caracterizá-las, seria necessário utilizar mais 
momentos estatísticos, além da média e da variância. A transformação a 
ser descrita não prevê o cálculo de outros momentos, portanto, uma das 
aproximações implícitas em tal desenvolvimento é a caracterização de uma 
função de densidade de probabilidade não-gaussiana por meio de média e 
variância. 


9.5.1 A transformação unscented 


A transformação unscented reduz um potencialmente grande número de 
vetores de estado (as muitas realizações de x) a um pequeno número de 
vetores, chamados de pontos sigma. Deve ser notado que, apesar do uso 
da palavra pontos, trata-se de vetores (pontos no espaço IR"). Portanto, 
a idéia principal é escolher um conjunto de pontos sigma, indicados por 
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Xi, i =0,1,... ,2na, em que na é a dimensão do vetor de estado aumentado. 

Ainda nesta seção, serão fornecidos detalhes sobre como escolher os pon- 
tos sigma. Por agora, basta notar que a escolha de X; deve ser tal que a 
média e covariância desses pontos e do vetor de estado aumentado sejam 
iguais, ou seja, deseja-se que 


2ns 


1 
E Su=* e cv(y)=P, (9.42) 
i=l 


em que, como antes, P é a matriz de covariância de x e X indica a média. 

Os pontos sigma, que satisfazem (9.42), podem ser propagados pelo 
modelo não-linear f de modo a gerar um conjunto de “pontos sigma propa- 
gados" Y; = f(X;). A média e a covariância desse novo conjunto de pontos 
); podem ser determinadas de maneira numérica utilizando relações conhe- 
cidas para a média e covariância amostrais. Os valores, assim determinados, 
podem, então, ser tomados como aproximações (estimativas) da média e da 
matriz de covariância do vetor de estado propagado y, ou seja, 


2na 


1 É 
e 5% ny e cov(V)=Py 
im a 
O vetor de estado aumentado é 


xp = [XE wk val", (9.43) 


cuja dimensão é na = 2n +m, portanto, x; E IR2"+M sendo n a dimensão 
do espaço de estado original, e m, o número de saídas. Uma consegiiência 
de definir o vetor aumentado dessa maneira é que a matriz de covariância 
dos erros de estimação — também aumentada — deve se referir ao vetor 
aumentado, ou seja, 


P00 
PE | 0 Q 01, (9.44) 
00 R 


em que, claramente, P? € IR(n+m)x(In+m), 
Os pontos sigma são escolhidos da seguinte forma: 
O (kk) = 8º (kk) 
AP (kk) = *º(KJk) + [Va FIPE | (9.45) 
Mim BIK) = 8º(b1h) — [ (a + PATR) | 
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em que a nomenclatura foi alterada um pouco para evitar conflito de índices. 
Deve ser notado, contudo, que tal nomenclatura é equivalente à utilizada em 
seções anteriores, ou seja, %º(k|k) indica %;*. Os pesos em (9.45), relativos 
ao cálculo de média e covariância, são escolhidos de tal forma que 


do=s 
pp +B (9.46) 
vu = 0, = ul, = vb, = 

sendo i = 1,...,Na € [VOl: tanto pode ser a i-ésima linha ou coluna da raiz 


quadrada da matriz, dependendo da formação da matriz. Especificamente, 
se a matriz for do tipo ATA, as linhas de A devem ser usadas. Entretanto, 
se a matriz for AA”, então, as colunas de A devem ser usadas para compor 
os pontos sigma (JULIER; UHLMAN, 2004). 

Para simplificar a escolha dos pontos sigma, é comum escolher o pará- 
metro À = c2(k +na) - na = 0, ou até mesmo tomar a =1,n=0e8=2. 
A escolha dos pontos sigma como em (9.45) garante que os dois primeiros 
momentos (média e covariância) sejam exatamente ajustados. Além disso, 
se a distribuição de densidade de probabilidade do vetor de estado for simé- 
trica, o terceiro momento, que é nulo, também é ajustado de maneira exata. 
Outras maneiras de escolher os pontos sigma são discutidos em (JULIER; 
UHLMAN, 2004). 

Finalmente, o filtro de Kalman unscented pode ser escrito como 


AF(RAJR) = SMP (RIR (A, A (IR), 

DRA) = [MF (+), AF (AIR) 

*(R+Jk) = 523 ul” FR), 

PURA) = 5526 vb (+), 

P(k+ JK) = 35228 ml [xz (Rh) — Ra + DRAX (R+ DK) — Si(e + 1]6)]T 
Pool IR) = Dig vb [Dik] — Sae UPE) — Sa DAT 
Peg +) = Dt ola (MJ) — Ses (+ DIR) (R+ AR) — Pol MJ)” 


K(k+1) = Poy(k+]K) PA (R+ |), 
(9.47) 


sendo à =0,... ,2na é A2(k — 1]k — 1) são dados por (9.45) e 
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AP = (47) (avr (RUI, 


As duas primeiras equações em (9.47) simplesmente propagam os pon- 
tos sigmas pelo modelo não-linear. As duas equações seguintes fornecem 
estimativas das médias dos vetores propagados, sendo que a estimativa da 
matriz de covariância (amostral) é dada pela quinta equação. As duas 
equações seguintes são cálculos intermediários para determinar a matriz de 
ganho de Kalman, na últma equação de (9.45). 

As equações de correção podem ser escritas como: 


S(R+LJR+1) = X(k+Jk) + K(k+Dly(k+1) — y(k+1]k)] 
P(k+]k+1) = P(R+ JK) — K(k+1)Poy(R+-MK)KT (41), 


lembrando que X(A+1|k+1) = &f,, € P(k+1]k+1) = P$,,. É interessante 
notar que as equações de correção do KF, EKF e UKF são idênticas, ao 
passo que a etapa de propagação dos estados é feita utilizando um modelo 
linear, no caso do KF; e utilizando o modelo não-linear, no caso dos algo- 
ritmos EKF e UKF. É interessante notar que tanto o EKF quanto o UKF 
calculam a média e a covariância de maneira aproximada (JULIER et al., 
2000). No caso do EKF, a aproximação resulta da linearização analítica. 
Por outro lado, no caso do UKF, a aproximação decorre do fato de que os 
pontos sigma não têm informação sobre todos os momentos da distribuição 
a priori (TEIXEIRA, 2006). 

Finalmente, a escolha da matriz de covariância geralmente requer de- 
terminar valores para Q e R (ver 9.44). Q pode ser utilizada para refletir 
o grau de confiança que se tem no modelo utilizado na implementação do 
UKF, ao passo que R deve refletir o nível de ruído nas medições, uma vez 
que é a matriz de covariância do ruído, Em aplicações práticas pode-se 
tomar Q como uma matriz diagonal em que os elementos da diagonal são 
as variâncias dos erros de predição de um passo à frente, de cada elemento 
do vetor de estados, obtidos utilizando o modelo em questão, 


9.6 Aplicação do KF; Um Estudo de Caso 


O objetivo desta seção é mostrar e discutir alguns aspectos da aplicação 
de filtragem em sistemas não-lincares na estimação de estados utilizando 
modelos identificados para a implementação do filtro de Kalman, 

Como visto nas seções iniciais deste capítulo, a fim de executar n etapa 
de propagação em problemas de filtragem não-linear, é necessário um mo- 
delo matemático. Na prática, em algumas situações, tais modelos não são 
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conhecidos a priori e, portanto, devem ser obtidos antes de implementar o 
filtro. Nesta seção descreve-se a implementação do algoritmo UKF a partir 
de modelos construídos a partir de dados. O sistema em estudo é o oscilador 
de Chua, que também será considerado na Seção 16.2. 

Os dados foram coletados de uma montagem projetada por Leonardo 
Torres (TÔRRES, 2001; TÓRRES; AGUIRRE, 2005) e processados por Bruno 
Teixeira. Os detalhes podem ser encontrados em (AGUIRRE et al., 2005). 
A referida montagem baseia-se em um oscilador eletrônico com dinâmica 
caótica. O principal pico na função de densidade de potência espectral 
encontra-se em torno de 1,6Hz, o que permitiu amostrar os dados com 
Ts; = 30ms. 


n10* 


=(k) (ma) 
Lo-uus a 


O 


vim o ESA 


FIGURA 9.5: O atrator dupla-volta medido, Esses dados foram usados na iden- 
tificação de um modelo multivariável. 


Utilizando os dados mostrados na Figura 9.5, tanto modelos polinomiais, | 
quanto neurais do tipo perceptron multi-camadas foram identificados. Em 
todos os casos (mesmo para os modelos polinomiais), a “camada de entrada” 
era constituída de [z(k — 1), y(k — 1),z(k — 1)]”. Um modelo (polinomial 
ou rede) distinto foi identificado para cada uma das variáveis de estado. No 
caso das redes, as funções de ativação na única camada escondida foram 
do tipo tangente hiperbólica e a função do nodo de saída era linear. Um 
grupo de redes foi treinado com 2 nodos na camada oculta e outro grupo, 
com 7 nodos na camada oculta. Esses grupos serão chamados de MLPs2 e 
MLPs7, respectivamente, 

O UKF com o modelo polinomial identificado foi usado para estimar | 
todo o vetor de estado do oscilador eletrônico, utilizando apenas a variável 
de estado x para alimentar o filtro, conforme mostrado na Figura 9.6. 

Três situações foram investigadas, nas quais o UKF foi implementado 
com: i) o modelo identificado sem modificações (ótimo do ponto de vista da 
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(dh) 


modelo 


Figura 9.6: Representação esquemática da estimação de estados e parâmetros 


o (parâmetros) 


Dado o modelo (Identificado) e um sinal (z(k), o UKF estima 
os demais estados, bem como alguns dos parâmetros do próprio 
modelo, 


minimização da variância dos resíduos); ii) o modelo identificado com pe- 
quenas modificações (com um melhor comportamento global em simulação 
livre, mas subótimo do ponto de vista da minimização da variância dos re- 
síduos); iii) utilizando o modelo do item i, mas com três de seus parâmetros 
sendo estimandos juntamente com os estados, Os casos iv e v são equiva- 
lentes ao caso i, mas foram implementados com as redes MLPs2 e MLPs7, 
respectivamente. Em todos os casos a matriz (Q foi escolhida diagonal com 
elementos iguais à variância dos resíduos do respectivo modelo, No caso iii, 
em que três parâmetros foram estimados simultaneamente com os estados, 
os respectivos elementos de Q) foram tomados como sendo a autovariância 
desses parâmetros (ver Eq. 6.38). Os resultados são mostrado na Tabela 9.1. 


TABELA 9.1: Valor eficaz (RMS) do erro de estimação dos estados 


Desempenho do UKF em diversas condições, para o caso do circuito eletrônico. 


situação investigada 
(i) modelo ótimo 

(ii) modelo subótimo 
(iii) estimação conjunta de parâmetros 
(iv) MLPs2 

(v) MLPs7 


FONTE 


2,80x10-7% 2,58% 0,87% 
3,75x10-7% 5,85% 2,86% 
3,70x1077% 3,09% 1,24% 
2,57x1077% 2,06% 
9,93x10-7% 1,27% 


adaptado de (Aguinne; Teixeira; TÔRRES, 2005). 


O fato dos erros de estimação de » serem tão baixos deve-se a dois 
fatores. Em primeiro lugar, o ruído de medição é baixo, Em segundo lugar, 
deve ser lembrado que a variável x é a variável utilizada para alimentar o 
filtro. 

Pelos resultados da Tabela 9,1 percebe-se que o modelo estatisticamente 


ótimo deve ser preferido ao subótimo, ainda que este tenha comportamento 
global superior. 
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do usar o filtro para estimar três parâmetros além dos estados (caso ili), 
os parâmetros estimados convergem para os valores originalmente estimados 
na etapa de identificação do modelo. Como consequência, o desempenho do 
filtro nos casos À edil é muito próximo, 

Pinalmentes a implementação do filtro com as redes MLPs2 e MLPs7T 
teve desempenho comparável ao caso polinomial. Vale a pena ressaltar que 
ao somar ruído adicional à variável x, a implementação do filtro com a rede 
MLPST mostrou-se significativamente mais robusta do que nos outros casos 
(AGUIRRE et al, 2005). 


Leitura Recomendada 


Tipicamente, livros sobre a teoria de identificação de sistemas mencionam 
o filtro de Ralman no contexto de estimação recursiva e modelos em espa- 
co de estados, filtragem ótima e assim por diante (LJUNG; SODERSTRÔM, 
1983; NoRTON, 1986; SODERSTRÔM; STOICA, 1989; LJUNG, 1999). À ver- 
satilidade do filtro de Kalman é tal que se presta a aplicações como, por 
exemplo, treinamento de redes neurais (HAYKIN, 1994) e análise de séries 
temporais (HAMILTON, 1994), o que justifica sua menção em textos sobre 
esses assuntos. Uma boa ilustração da versatilidade do algoritmo conhecido 
como filtro de Kalman pode ser encontrada em (DE FREITAS PINTO; RIOS 

Neto, 1990), onde tal algoritmo foi utilizado para encontrar a solução de 

um sistemas de equações algébricas lineares; para treinar redes neurais tipo 

MLP (Choi et al., 2005); ou para estimar os parâmetros de redes RBF 

(WaLkER; MEES, 1998), 

Por outro lado, é comum que livros dedicados a processamento de sinais 
e filtragem dediquem capítulos completos no filtro de Kalman (MayBECk, 
1979, Havkin, 1996; MOON; STIRLING, 2000; CRASSIDIS; JUNKINS, 2004; 
Simon, 2006). Memerly dedica um capítulo no filtro de Ralmamn em livro 
sobre controle digital (HEMERLY, 2000). Do conjunto de obras citadas o 
livro escrito por Maybeck (1979) merece especial destaque. Essa reterência 
apresenta o problema da filtragem de Kalman de maneira muito didática é 
praticamente não presume conhecimento prévio sobre o assunto. Não é de 
admirar que seja uma das referências mais citadas quando se trata de livros 
introdutórios ao filtro de Kalman, 

O capítulo escrito por Rios Neto e Hemerly (2007) é fortemente ecos 
mendado por ser simultaneamente introdutório, mas também por incluir 
aspectos fundamentais à prática da filtragem de Naliman. 

O filtro de Kalman unscented (UKE) foi apresentado pela primeira ves 
em meados da década de 90 por Simon Julier e seus colegas (JuLtER et al, 
1995; Jutici et al, 2000). Um ótimo trabalho tutorial foi publicado em 
(JuLigk; UnLMANN, 2004), onde diversos aspectos envolvendo a escolha dos 
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pontos sigma são discutidos, Em dois trabalhos, Sitz e colegas discutiram, 
baseados em simulações e supondo modelos conhecidos, o uso do UKF no 
contexto de sistemas e sinais caóticos (Strz et al., 2002; Srrz et al., 2004). 
O uso do UKP, implementado a partir de modelos identificados, no contexto 
de sistimas e sinais caóticos, foi apresentado pela primeira vez em (AGUIRRE 
et al., 2005). Exemplos de aplicação em que foram comparados os EKF e 
o UKF foram apresentados e discutidos em (BITENCOURT JUNIOR, 2003) 
e, no contexto de reconstrução de trajetórias de vôo em (TEIXEIRA et al., 
2005). Apesar de se tratar de uma proposta bastante recente, é notório 
que o UKF já seja apresentado em livros (CRASSIDIS; JUNKINS, 2004). 
Um tutorial que compara algumas alternativas de filtragem para sistemas 
não-lineares foi apresentado em (Daum, 2005). 

Apesar de um pouco antigo, o compêndio, de 44 artigos, editado por 
Sorenson (1985), é bastante interessante. Além de reproduzir os artigos 
originais de Kalman, o compêndio inclui diversos outros artigos que retra- 
tam como a teoria se desenvovleu até por volta de 1971 e traz 19 artigos 
sobre aplicações do filtro de Kalman, que foram publicados em um número 
especial da IEEE Transactions on Automatic Control, em março de 1983. 
Outras aplicações inlcuem o trabalho de Quirino e Bottura (2001), no qual 
discutem a implementação distribuída do filtro de Kalman e o trabalho de 
Teixeira (2006), que inclui implementações iterativas do filtro e suavizador 
de Kalman nas suas versões estendida e unscented. 


Exercícios 


9.1. Considere o sistema linear descrito por (8.42). Escolha quaisquer três 
entradas exógenas (por exemplo, constantes ou aleatórias) para compor o 
vetor u(k — 1). Tome 200 valores, para o vetor de estado x(k — 1), de uma 
distribuição gaussiana de média e variância quaisquer, Propague cada um 
desses vetores utilizando (8.42) com os mesmos valores de u(k = 1) a fim de 
achar os 200 valores correspondentes de x(A), Faça histogramas de x(k — 1) 
e de x(k) e comente sobre o formato das duas distribuições. 


9.2, Demonstre que Elk! wk] = Elwy(Xj)"] = 0, 
9.3, Demonstre que E[x; vj] = 0 e que Elvk(X/)"] = 0. 
9.4, Derive a expressão (9,29). 


9.5. Derive a expressão (9.92). 
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Representações Não-Lineares 


Os sistemas dinâmicos encontrados na prática são, em última análise, não- 
lineares. É bem verdade que em alguns casos aproximações lineares são 
suficientes para aplicações práticas. Entretanto, numa série de exemplos, 
modelos lineares não serão satisfatórios, e representações não-lineares deve- 
rão ser usadas. A escolha de modelos não-lineares, entretanto, traz consigo | 
um inevitável aumento na complexidade dos algoritmos a serem utilizados. 
Face à escolha de que tipo de modelos usar, se lineares ou não-lineares, | 
| 


| 
| 
10.1 Introdução | 
| 
| 
| 


é importante lembrar que, ao contrário do que possa parecer, melhorar a 
exatidão dos modelos não é a principal motivação para se usar modelos não- 
lineares. De fato, há razões mais fortes para, em uma dada aplicação, optar 
por modelos não-lincares, como, por exemplo, o fato de modelos não-lineares 
produzirem certos regimes dinâmicos que modelos lineares não conseguem 
representar. Considere um modelo de uma geladeira para o qual a entrada 
é a potência elétrica entregue ao compressor e cuja saída é a temperatura. 
Para operação com a porta fechada, a geladeira tem dois comportamentos 
distintos, uma vez que seu resfriamento é forçado e o aquecimento se dá por 
troca de calor com o meio ambiente devido às perdas. Conseqiientemente, à 
constante de tempo dominante no aquecimento será muitas vezes maior do 
que a constante de tempo dominante durante o resfriamento, Claramente, 
um único modelo linear não conseguiria representar esse tipo de dinâmica. 
Por outro lado, modelos não-lineares, pelo menos em princípio, poderiam 
ser usados para representar tal comportamento. 

O objetivo deste capítulo é apresentar, ainda que de forma breve, algumas 
representações matemáticas não-lineares. Em particular, diversas represen- 
tações comumente usadas serão revistas na próxima seção. No restante do 
capítulo, serão descritas em mais detalhes a representação polinomial e a 
racional NARMAX, bem como algumas ferramentas úteis na análise de tais 
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modelos. No Capítulo 11 serão descritos algoritmos para a determinação 
da estrutura e estimação de parâmetros de tais modelos. 


10.2 Representações Não-Lineares 


Há uma grande variedade de representações não-lineares que, pelo menos 
em princípio, podem ser utilizadas na identificação de sistemas. Esta seção 
não objetiva listar um grande número de representações nem mesmo deta- 
lhar qualquer uma delas, mas objetiva fornecer uma visão geral de algumas 
representações existentes. 


10.2.1 A série de Volterra 


A saída y(t) de um sistema não-linear com entrada u(t) pode ser represen- 
tada pela chamada série de Volterra definida como 


O «oo 00 j 
v(t) = as hj gere ) (t — i) d' io (10.1) 
la Iê AT Tj Ud Ti) dTi 


sendo que as funções h; são os núcleos (kernels em inglês) e claramente 
são generalizações não-lineares da resposta ao impulso h,(t). De fato, para 
um sistema linear j = 1, a equação acima reduz-se à conhecida integral de 
convolução. 

Uma dificuldade prática da aplicação da série de Volterra na identifica- 
ção de sistemas é que, mesmo para sistemas pouco não-lineares, o número 
de parâmetros a determinar é muito grande. A grande necessidade de pa- 
râmetros é consegiiência da série de Volterra tentar explicar a saída y(t) 
apenas em função da entrada. Uma forma de se reduzir o número de pará- 
metros é utilizar bases de funções ortonormais como forma de parametrizar 
os núcleos (CAMPELLO; OLIVEIRA, 2007). Entre as funções usadas para 
esse fim encontram-se as funções de Laguerre (CAMPELLO et al., 2006) e as 
funções de Kautz (DA ROSA et al. 2006), 

Outra alternativa para reduzir ainda mais o número de parâmetros é 
utilizar valores da própria saída, além de valores da entrada, para determi- 
nar y(t), ou seja, utilizar recorrência ou auto-regressão da saída. Modelos 
NARX, sejam polinomiais ou não, têm essas características. 


10,2.2 Modelos de Hammerstein e de Wiener 


Dois tipos de modelos não-lincares, que foram bastante populares até o 
final da década de 70, são os modelos de Hammerstein e de Wiener, Ambos 
os modelos são uma composição de um modelo dinâmico linear H(s) em 
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cascata com uma função estática não-linear f(). No caso do modelo de 
Hammetstein, a não-linearidade estática precede o modelo dinâmico linear. 
A paritr da década de 90, o interesse por esses modelos voltou a aumentar, 
graças à sua aplicabilidade em problemas de controle não-linear. 

Os modelos de Hammerstein e de Wiener podem ser também definidos 
em tempo discreto, respectivamente como (ver Figura 10.1) 


vii) = aylk=-1D)+..+an,y(k=ny) +by(k= 1) +... + bnsv(k — mu) 
= ay(k=-1)+...+an,y(k = ny) + 
+flu(k= 1) +... +u(k- no) (10.2) 


Flav(k=1)) +... + an, U(k — ny) + bou(k — ra) +... 

a ba u(k é nu)) , 

= plasti(ue= 1)... t on fo ty(b = n9)) + bou(b = 19) +... 
+ bnçu(k — nu), (10.3) 


v(k) 


em que foi assumido que f é invertível e 74 é O atraso puro de tempo. Em 
problemas de identificação apenas tem-se acesso aos sinais y(k) e u(k) e a 
função f(-) é desconhecida. 


(a) 

k 

u(k) To MF ap PÉ ) 
(b) 


k 
u(k) [rx [É fe) »(k) 


Figura 10.1: Representações de blocos interconectados 


(a) modelo de Hamunerstein, (b) modelo de Wiener. Em aplica- 
ções práticas não se tem acesso à variável intermediária v(k), que 
é uma variável fictícia, 


Observando-se a Figura 10.1 não fica evidente quais são, se é que exis- 
tem, as diferenças dinâmicas entre as representações de Hammerstein e de 
Wiener, É possível mostrar analiticamente que os autovalores da matrix 
jacobiana de modelos de Hammerstein são constantes, ao passo que nos mo- 
delos de Wiener tais autovalores dependem do ponto de operação (COELHO, 
2002; AGUIRRE et al., 2005). 
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10.23 Algumas representações NARX 


Os modelos NARX (do termo em inglês nonlincar autoregressive model with 
exogenous variables) são modelos discretos no tempo que explicam o valor 
da saída o em ad ef e prévios dos sinais de saída e de entrada, 
ou seja, y(k) = Fly(k co y(k — ny), u(k — 74)... ,u(k — mu)), sen- 
do que Ny á e Td são os pes atrasos em y, em u e o tempo morto, 
respectivamente. Como visto no Capítulo 7, a fim de se evitar polariza- 
ção de parâmetros é comum incluir termos de ruído no modelo. Quando 
isso é feito, o modelo passa a ser um modelo NARMAX (do inglês nonli- 
near autoregressive moving average model with exogenous variables), que é 
normalmente representado da seguinte forma: 


vo) = Ply(k= (= my), uk ra) o 
cou(k — nu), e(k), e(k — 1)... se(k — ne)), (10.4) 


sendo que e(k) é o ruído e ne é o maior atraso no modelo de ruído. Como 
pode ser percebido, o modelo (10.4) é muito geral. Uma dificuldade óbvia é 
determinar a função F. Duas representações NARMAX comumente usadas 
para F são a polinomial e a racional. Um modelo polinomial NARMAX 
sem atraso puro de a tem a seguinte forma: 


vm)=D a a Tuts plfut-nlf ato. (10.5) 


q=0 


É interessante notar que os modelos polinomiais bilincares são casos par- 
ticulares do modelo polinomial (10.5) quando todos os termos não-lineares 
são do tipo y(k — i)u(k — 5), Visj. 

Modelos racionais são formados pela razão entre dois polinômios, ou seja 


vt) = Lia La vlk - 5) rev u(k — 1) TIç£y elk — q) 
Di di TI; vlk = 5) Té: E ue =) É E e(k — q) 


Apesar de permitir utlilizar regressores não-lineares nos sinais de saída, 
entrada e ruído, os modelos polinomiais do tipo mostrado na Eq. 10.5 são li- 
neares nos parâmetros. Ou seja, modelos desse tipo podem ser representados 
na forma y(k) = 170 e, conseqiientemente, muitos dos resultados discutidos 
em capítulos anteriores e no Anexo B ainda são válidos. Por outro lado, os 
modelos racionais são não-lineares nos parâmetros e algoritmos alternativos 
precisam ser derivados para estimá-los. 

Em função de terem uma estrutura mais flexível, os modelos racionais 
podem vir a ser mais eficientes na modelagem de certos sistemas quando 
comparados com modelos polinomiais. Entretanto, os modelos racionais são 
mais sensíveis ao ruído. 


+e(k). (10.6) 


da 
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10.2.4 Modelos polinomiais contínuos 


Suponha-se agora um sinal y(t) contínuo no tempo. Um modelo polinomial 
para este sinal pode ser formado utilizando-se o sinal e suas derivadas como 
base. Considere o caso de ordem três. Escolhe-se X =Y =), Y =Ze 
2 = F(X,Y,2). Nesse caso, os regressores (X,Y,Z) são o sinal y(t) e suas 
derivadas primeira e segunda 1) e ij. A função F pode então ser aproximada, 
por exemplo, por uma expansão polinomial ou racional de combinações não- 
lineares dos regressores. No caso polinomial, o modelo pode ser representado 
da seguinte forma: 


X = ótt) 

Y = j(t) 

Z = 50, (10.7) 
l=1 


sendo 1! = X'YiZ* e i,j,k € IN. O problema de definir o número e quais 
termos devem ser utilizados para compor a expansão polinomial neste caso 
é muito semelhante ao caso discreto. Aqui, entretanto, há uma dificuldade 
adicional, que é a necessidade de se estimar as derivadas do sinal medido 
y(t). Um procedimento simples e eficiente em algumas aplicações práticas 
será discutido no Complemento 10.2. 


10.2.5 Funções radiais de base 


As funções radiais de base (RBF do inglês radial basis functions) são mapea- 
mentos do tipo 


Ne 
16) =m0+D ué ye: (10.8) 
í 
sendo que y € IRºs,! ||: || é à norma euclidiana, w; E IR são pesos, Nç é o 


número de centros e; € IR“ e (+) : IRt > IR 6 uma função, normalmente 
escolhida a priori, como, por exemplo; 


d) 


= el? 

ly —e; ||) = exp (La) ; (10.9) 

sendo o; constante e || y — e; [º=(y-c;)"(y — ci). A função de base (10,9) 
é chamada de gaussiana. Outras funções de base usadas são: 


dscapisqmo o 
Ide é conhecido como a dimensão de imersão. 


Digitalizado com CamScanner 


376 10 REPRESENTAÇÕES NÃO-LINEARES 


Multiquadrática inversa: &(r) = (12 + 02)-05 


Linear : dr)=r 

Cúbica : dr)=r? 
Multiquadrática ; dlr) = VrZ + o? 
Thin — plate spline : &(r) = rº logfr]), 


sendo que r =|| y—c; || e o define a largura do “chapéu”, no caso das funções 
gaussiana e das multiquadráticas, como pode ser visto na Figura 10.2. 


Figura 10.2: Função multiquadrática inversa 


Função multiquadrática inversa para vários valores do parâmetro 
o:(-)o=1,(---)o=05e(:--)o = 0,25. 


Essa representação pode ser interpretada como uma técnica de interpo- 
lação global com boas propriedades locais. As funções radiais de base são 
casos particulares de redes neurais, mas, ao contrário destas, são lineares 
nos parâmetros 1w;, conforme pode ser verificado na Eq. 10.8. Se a função 
é&(:) : IR? > RR e os centros c; forem conhecidos, os parâmetros w; podem 
ser estimados utilizando os métodos discutidos nos Capítulos 5 a 7. 

No contexto de identificação de sistemas, é comum acrescentar termos 
auto-regressivos lineares, bem como termos de entrada, à função (10.8), 


resultando em 


Digitalizado com CamScanner 


10.2 REPRESENTAÇÕES NÃO-LINEARES 377 


Ne 
vs) = ut ul y(k=1)-c|)+ 
+Sagtk =1) + bulk —1) +e(k), (10.10) 
i=l i=l 


sendo y(k—1) = [y(k=1)...y(k—ny) u(k=—1)...u(k—nuy)]”, e(k) é 0 erro 
e o vetor de parâmetros é O = [wow ...wn, 01...Gn, bi... Dn)”. No caso 
de o sistema possuir atraso puro de tempo, 74, Os termos lineares de entrada 
começariam com u(k—74). Em (10.10) 0 E IRº, sendo que a dimensão do 
vetor de parâmetros é q= N.+1+ny+ Nu. 


10.2.6 Redes neurais artificiais 


As redes neurais artificiais são um outro tipo de representação não-linear. 
Tais redes são compostas por camadas de neurônios interconectados. A 
saída de um único neurônio com n entradas é do tipo 


5 
c=[/Sug;+b|, (10.11) 
ja 


sendo que b (bias) e w; são constantes e f é chamada de função de ativação. 
A semelhança da função &(:) : IR? > IR, no caso das funções radiais de 
base, há vários tipos de função de ativação, sendo que uma das mais comuns 
é a sigmóide 


1 


He) = ler" 


(10.12) 


Deve ser notado que, como é normalmente o caso nas redes neurais 
smulticamadas, a saída de um neurônio do tipo mostrado na Eq, 10.11 é 
conectada à entrada de um outro neurônio, Nesse caso, a saída de uma 
rede com um único nodo na camada de saída e uma camada oculta é uma 
função não-linear nos parâmetros do tipo 


u(k) = fo [Ema (E Wiz; +b; | + 1) i (10.13) 
i=1 j=1 


sendo que fs é a função de ativação do neurônio da camada de saída. Tal 
função não precisa ser igual a f;, à = 1,... mM, que, por sua vez, não 
precisam ser iguais entre si. bs é o termo de polarização do neurônio da 
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camada de saída, w; são os pesos da saída de cada neurônio da camada 
oculta e tvi; São os pesos da entrada j, vista pelo i-ésimo neurônio da camada 
oculta. Em aplicações de identificação, é comum escolher fs(z) = z e bs = 0; 
assim (10.13) fica 


uk) =5 wifi Do uizy + bi , (10.14) 


i=l j=1 


que ainda é não-linear nos parâmetros (ver Exercício 10.3). Consegiiente- 
mente, os algoritmos discutidos no Capítulo 5, por exemplo, não são ade- 
quados para estimar os pesos de redes neurais multicamadas. A fim de 
se estimar os parâmetros de uma rede neural multicamada, são utilizados 
algoritmos de estimação não-linear, tais como o de retropropagação do er- 
ro (do inglês backpropagation) (HavkiIN, 1994) ou o operador de extensão 
(PEDROZA; PEDREIRA, 2000). 

Antes de encerrar esta seção, deve ser mencionado que, apesar das repre- 
sentações apresentadas nesta seção serem bastante distintas, há problemas 
comuns a todas elas. Um exemplo disso é o problema da determinação 
da estrutura dos modelos não-lineares. Ou seja, precisa-se definir quais e 
quantos regressores serão usados para compor o modelo. No caso de redes 
neurais, a determinação de estrutura (a topologia da rede) envolve escolher 
o número de nodos, o número de camadas, o tipo da função de ativação, 
quais conexões são necessárias, e que variáveis de entrada usar. No caso das 
funções radiais de base, é necessário escolher quais são os centros a serem 
utilizados, bem como definir quais são as entradas da rede e qual função 
de base usar. Como será visto mais adiante, esse problema não é apenas 
complexo devido à grande variedade de possibilidades, mas também é um 
problema crítico, uma vez que um modelo não-linear cuja estrutura não seja 
adequada apresentará diversos problemas dinâmicos. 


10.2.7 O neurônio neo-fuzzy 


O neurônio neo-fuzzy (NFN do inglês neo-fuzzy neuron) é constituído por 
três camadas: a camada de entrada, a camada de agregação de regras e a 
camada de saída, como pode ser visto na Figura 10.3. Cada um dos np nodos 
de entrada possui p partições, representadas por p funções de pertinência 
triangulares, fixas e regularmente distribuídas no espaço de excursão da 
variável associada. A Figura 10.4 mostra esquematicamente as funções de 
pertinência dos nodos de entrada do NFN. Pode-se notar que, graças à forma 
com que essas p funções de pertinência estão distribuídas, no máximo duas 
delas estarão ativas para um dado valor x; de entrada. Além disso, a soma 
do valor das funções ativas fj(x;) + fj+1(z;) é sempre igual a um. 


1 
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FiGurA 10.3: Topologia do neurônio neo-fuzzy 


C1 é a camada de entrada, C2 é a camada de agregação de regras 
e C3 é a camada de saída. 


A j-ésima partição de um dado nodo de entrada i é ponderada por um 
peso w;,j, então é possível escrever que a saída do i-ésimo nodo de entrada 
após a agregação de regras é: 


p 
a =5 fislmui (10.15) 
jel 


sendo wi; pesos ajustáveis no treinamento do NFN. Deve ser lembrado que 
no somatório da Eq. 10.15, no máximo dois elementos são não-nulos para 
cada valor da entrada. 

Tendo em vista o tipo de função de pertinência utilizado, a última ca- 
mada realiza a composição de todas as regras por meio de um somatório, 
ou seja, 


Mn 
je 
i=] 


Como apenas duas partições encontram-se ativas para um dado valor em 
cada nodo de entrada, a saída 1 pode ser obtida diretamente pela relação: 


v="6, (10.16) 


sendo f € IR2"»X1 um vetor definido como 


E = (f(x) frs(m) fop(mo) fopsi(mo) oo fm Zn) fnnm(Znn)]” 


Digitalizado com CamScanner 


380 10 REPRESENTAÇÕES NÃO-LINEARES 


partições 


Figura 10.4: Funções de pertinência do neurônio neo-fuzzy 


As funções de pertinência desta figura referem-se aos nodos de 
entrada. Como apenas duas delas estão ativas para um dado valor 
de z; e a soma das funções de pertinência é sempre igual a um, o 
estimador MQ pode ser utilizado para treinar o NFN. 


e Ç € IR22=X! um vetor definido como 
C= [ui wir W2k Wok Un, im Unam+d]”. 


A Eq. 10.15 é linear, porém, deve-se notar que, devido à existência de 
partições de entrada, o NFN é linear por partes, configurando uma repre- 
sentação globalmente não-linear. 

Considerando-se um conjunto de treinamento composto por N pares 
(x,y), a Eq. 10.16 pode ser usada para montar um conjunto de N restrições, 
à semelhança do que foi feito na Seção 5.2, Escrevendo-se o resultante 
conjunto de restrições na forma de uma equação matricial, obtém-se: 


y=Yw, (10.17) 
em que y € IR” e o vetor de parâmetros (pesos) w € IR?"" é definido como 


w = [wa Wi2 e Wip Wa W29 «++ U2p Un Una ce» Une)” . 


Cada linha da matriz Y em (10,17) tem 2N valores diferentes de zero 
(dois por nodo de entrada). Dessa forma, o vetor de pesos w pode ser 
estimado por meio de mínimos quadrados clássico, ou seja, 


w=[UTW]-yTy, 


| 
ma 
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Como a matriz Y é esparsa, determinados cuidados numéricos são im- 
portantes na obtenção dos pesos. Deve ser notado que a razão de W ser 
esparsa advém do fato de que ao se montar o conjunto de restrições (10.17), 
para cada valor da entrada, apenas duas funções de pertinência, e con- 
seqientemente dois pesos, estarão ativos. 


10.3 O Modelo Polinomial NARMAX 


Nesta seção a representação polinomial (10.5) será detalhada, A escolha da 
estrutura e a estimação dos parâmetros de tais modelos serão discutidas no 
Capítulo 11. Para começar, será considerado o caso em que o sistema tem 
um atraso puro de tempo, rg. Outra importante consideração a ser feita é 
a seguinte. 


Consideração 10.1. Nenhum termo cujo parâmetro tenha que ser estimado 
pode depender de e(k). 


A Consideração 10.1 implica em tirar e(k) de dentro dos colchetes em 
(10.4), o que equivale a fazer q = 1 e acrescentar e(k) em (10.5). Portanto, 
tem-se 


u(k) = Fly(k=1),... y(k=ny)u(k= a), .. 
e u(k—nu),e(k=1),... e(k-ne)]+e(k), (10.18) 


sendo que e(k) indica todos os efeitos que não podem ser bem representados 
por F*[.), que é uma função polinomial de y(k), u(k) e e(k) com grau de 
não-linearidade £ € IN. Portanto, a parte determinística de (10.18) pode 
ser expandida como o somatório de termos com graus de não-linearidade 
variando na faixa 1<m <£. Assim sendo, cada termo de grau m poderá 
conter um fator de grau p do tipo y(k — i) e um fator de grau (m — p) 
do tipo u(k — i) sendo multiplicado por um parâmetro representado por 
Cpm-p(ni,..« Mm). Matematicamente, tem-se 


Lo m NyMu Pp m 
vi) =5555 55 complmas cos) T]ulk = mi) TT u(t = mi), 
m=0 p=0 nim i=l i=p+ 
(10.19) 
sendo que 

MyMu ny Ny 

br = Ds: or 35 (10.20) 

Nim  m=l nm=l 
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e o limite superior é ny se o somatório se refere a fatores do tipo y(k — n;) 
ou ny para fatores do tipo u(k — n;). Deve ser notado que os parâmetros 
dependem do tempo de amostragem e deveriam, a rigor, ser representados 
por Cpm-p(Tema, ++ Mm), mas, para simplificar a notação, a indicação de 
T, será omitida. 


Exemplo 10.3.1. Modelo polinomial NARX 


Neste exemplo será mostrado o caso em que a função F'[:] é expandida 
como um polinômio de grau dois, ou seja, F?[]. Portanto, tomando-se £ = 2 
em (10.19), tem-se 


6) = c00+ 5 cxolmulk ni) + DO con(mi)u(k — m) 


m=1 m=1 
+35 DS exolmana)y(k — m)y(k — na) 
+ 5 A (mina)y(k = ni)u(k — na) 
+ SEP coamimajuk = my)u(k — no). (10.21) 


m m 


[| 


A estimação dos parâmetros de modelos polinomiais NARMAX será 
vista em detalhes na Seção 11.2. Por enquanto, basta notar que, a fim de 
estimar os parâmetros em (10.19), será conveniente colocar o modelo na 
forma 


uk) =bT(k — 1)Ô + E(k). (10.22) 


À semelhança do caso linear, W(k — 1) é o vetor de regressores que 
pode incluir medições até o instante (k — 1). A diferença está no fato de 
que em (10.22) é possível ter regressores não-lineares. Ou seja, é possível 
ter combinações lincares e não-lineares dos sinais y(k), u(k) e do vetor de 
resíduos E(k) até o instante (k — 1), conforme ilustrado no próximo exemplo. 


Exemplo 10.3.2. Regressores de um modelo polinomial NARX 


Assumindo-se n, = 2 e ny = 1 para o modelo do Exemplo 10.3.1, tem-se 
o seguinte vetor de regressores: 
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W(R=1) = [u(k-1) y(k-2) u(k=1) (k=1)? y(k=1)y(k—2) 
v(k=2)2 u(k=1)2 y(k=1)u(k=1) y(k=2)u(k=1)]". 


O conjunto de regressores que formam o vetor W(k-1) é completo no 
sentido de que inclui todos os regressores possíveis dados os máximos atrasos 
ny = 2e ny = 1, bem como o grau de não-linearidade £ = 2, Não é difícil 
perceber que se em uma determinada aplicação os máximos atrasos forem 
um pouco maiores e o grau de não-linearidade for, por exemplo, £ = 2, o 
número de possíveis regressores aumenta demasiadamente. Assim sendo, na 
prática, não é possível trabalhar-se com conjuntos completos de regressores. 
As técnicas de escolha de estruturas a serem discutidas no Capítulo 12 
objetivam derivar subconjuntos “ótimos” de regressores. [a] 


Em vista do Exemplo 10.3.2, deve estar claro que o número de regres- 
sores candidatos para o caso não-linear é significativamente maior do que 
para o caso linear. Conseqientemente, será necessário utilizar ferramentas 
mais sofisticadas para a determinação da estrutura de modelos não-lineares. 
Esse assunto será tratado na Seção 11.3 e no Capítulo 12. 


10.4 O Modelo Racional NARMAX 

Um modelo racional NARMAX tem a seguinte forma geral: 
a(y(k=1), o oylk ny) u(k= 1)... su(k-mu), 
dly(k=1),... ylk=ny)u(k= 15... su(k=nuy), 


e(k — 1),... se(k—ne)) 
“Ce(k-1),... se(k-ne)) 


ulk) = 


+ elk). (10.23) 


Na Eq. 10.6 as funções do numerador e do denominador (funções a(...) 
e b(...) em (10.23)) são polinômios, mas essa é apenas uma alternativa. 
Assumindo-se que o modelo é formado pela razão entre dois polinômios, 
é conveniente definir o numerador e o denominador de (10.6) como sendo, 
respectivamente, 


Na 

a(k = 1) = 5 pnjOnj = PA(k — 1)0my (10.24) 
j=1 
Na 

b(k — 1) = 3 pasa; = I(k — 1)93, (10.25) 


j=1 
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sendo que ny € 0a são os parâmetros dos regressores que incluem informa- 
ção até o instante k— 1, Portanto, Ny + Ny é o número total de parâmetros 
a estimar, 

O uso de (10.6) não é adequado para a estimação de parâmetros utili- 
zando minimos quadrados pelo fato de tal representação não ser linear nos 
parâmetros. Uma solução alternativa será descrita na Seção 11.4, na qual 
ambos os lados de (10.6) serão multiplicados por b(k — 1). Manipulando-se 
os termos, chega-se a 


Ny 
a(k = 1) -u(k) 5 paj9a; + b(k — 1)e(k) 
j=2 


Na Na 
Do pasa; — U(K) D pasa; + C(k) 
ja ja 


valk — 1)0n — ulk)ba(k — 1)04 + C(k), (10.26) 


v'(k) 


H 


sendo va (k — 1) = [par Pãr(k — 1)), 0a =1 e 


v'(k) = y(k)pa = MEP + pare(k), (10.27) 


G(k) = b(k — 1)e(k) = [But | do (10.28) 


sendo e(k) branco. Como e(k) é independente de b(k — 1) e tem média zero, 
tem-se EIC(k)] = EIb(k — 1)]Efe(k)] = 0. 

O objetivo da manipulação acima é obter a Eq. 10.26 que é linear nos 
parâmetros e assim tentar estimá-los usando-se estimadores do tipo MQ. 
Como será detalhado no Capítulo 11, o fato de se poder usar estimadores 
(ortogonais) do tipo MQ para estimar parâmetros permitirá também resol- 
ver 0 importante problema de escolha de estrutura, Entretanto, a Eq. 10.27 
revela que todos os termos da forma y(k ij (k — 1), por causa de y(k), in- 
cluem o ruído e(k) que é correlacionado com o erro da equação de regressão 
((k). Em outras palavras, o erro ((k) está correlacionado com e(k) (ver 
Eq. 10.28), que, por sua vez, está correlacionado com o sinal de saída y(k) 
(ver Eq. 10.6). Portanto, usando-se (10.26) como equação de regressão 0 
uso de estimadores de mínimos quadrados resultará em polarização de pa- 
rúmetros uma vez que, como discutido acima, o erro dessa equação, C(k), 
está correlacionado com alguns dos regressores. 

A correlação mencionada no parágrafo anterior surge como conseqiiên- 
cia de se multiplicar ambos os lados do modelo racional por b(k — 1), e pode 


Digitalizado com CamScanner 


10.5 AGRUPAMENTO DE TERMOS 385 


ser interpretada como sendo o preço a ser pago ao se tentar estimar pará- 
metros de um modelo racional, que não é linear nos parâmetros, usando-se 
estimadores de mínimos quadrados. 


Exemplo 10.4.1. Um modelo racional NARX 


Um modelo racional é normalmente representado como a razão entre 
dois polinômios. Um exemplo de tal tipo de modelo é 


(6) = Sotoulho 1bou(k= 1) bosy(h= Iu(h1) + agu(k 10 
paid do +bou(k —1) 
(10.29) 


sendo que apenas os regressores relacionados a y(k) e u(k) são mostrados. 
Note que os polinômios do numerador e do denominador são independentes 


e podem conter regressores iguais. No modelo (10.29), o regressor u(k — 1) 
aparece tanto no numerador quanto no denominador. Uma das vantagens 
dos modelos racionais comparados aos modelos polinomiais é que, para 
valores do denominador perto de zero, a saída do modelo aumenta muito. 
Assim, é possível, em princípio, representar sinais com “saltos” abruptos, o 
que é muito difícil de se conseguir com modelos polinomiais. [a 


10.5 Agrupamento de Termos 


Como mencionado na seção anterior, um modelo polinomial NARMAX po- 
de ter diversos regressores, que são diferentes. Mas quão diferentes? Será 
que existe alguma forma de agrupar os regressores em classes? A fim de 
responder a essas perguntas foram definidos os agrupamentos de termos. 
No que se segue será apresentada a definição de agrupamento de termos e 
coeficiente de agrupamento. Para maior simplicidade, o assunto será inicial- 
mente abordado fazendo-se algumas considerações que não serão necessárias 
quando os modelos forem analisados em estado estacionário. Isso será feito 
na Seção 10.6. 

Um modelo para o qual n, = ny abrange uma janela de dados de com- 
primento (ny — 1)x Ts. Se essa janela de dados for suficientemente suave, 
as seguintes aproximações podem ser escritas 


vlk-D=y(k-2)=...my(k-ny) 
A pap a k (10.30) 


então a Eq. 10.19 pode ser rescrita como se segue: 
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Ny tm 
ul DD comeplnisoco sm) DO Do uk — 1Pu(k = 1)m=P. (10.31) 
nim m=0 p=0 


A Eq. 10.31 serve como motivação para as seguintes definições: 


Definição 10.5.1. (AGuirRE; BILLINGS, 1995) As constantes que apare- 
cem na Eq. 10.31, Datas Com-p(ta,... Mm), São 08 coeficientes dos agru- 
pamentos de termos N,pun-», que contêm termos da forma y(k — à)Pu(k — 
j)J"P para m=0,... 0 ep=0,...,;m. Tais coeficientes são chamados de 


coeficientes de agrupamentos e são representados por Dypum-p. 


Definição 10.5.2. (CORRÊA, 2001) O conjunto de todos os termos da for- 
ma y(k — d)u”(k — j) para m+p < € chama-se um agrupamento-d e é re- 
presentado por pum O somatório dos respectivos coeficientes é chamado 
de coeficiente-d e é representado por Bypum- 


Como será visto adiante, os agrupamentos de termos serão úteis para 
escrever expressões gerais de como o ganho do modelo varia com o ponto 
de operação. Semelhantemente, os agrupamentos-d serão igualmente úteis 
para entender como os autovalores da matriz jacobiana do modelo, ou seja, 
a dinâmica do modelo, variam com o ponto de operação. 

As aproximações na Eq.10.30 foram feitas para apresentar o conceito 
de agrupamento de termos de forma intuitiva. Na prática, as principais 
propriedades dos agrupamentos de termos são normalmente verificadas para 
os valores do tempo de amostragem, Ts, e ordem do modelo, ny, encontrados 
usualmente, Por outro lado, como será visto na Seção 10.6, os agrupamentos 
de termos podem ser definidos ezatamente quando se considera o modelo 
em regime permanente, para entradas constantes, 


Exemplo 10,5,1, Agrupamentos de termos de um modelo polinomial NARX 2 


Seja o modelo 


vlk) = 1 4269y(k = 1) = 0,41549 y(k — 3) + 0,012 y(k — 2) 
+0,11736 u(k= 3) = 0,04904 y(k = 1)º+1,2007 y(k— 1)2u(k— 3) 
+0,252 y(k — 3) u(hk — 2) — 0,0789346 u(k — 2) 
=0,47759 y(k — 2Q)y(k — 3)u(k — 3) — 0,0390695 y(k — 3)º 
+0,05843 p(k = 2)º-0,39072 y(k=2)u(k = 3)— 1272 y(k— 1 u(k 2) 
+0,44085 y(k = 2)y(k — 3)u(k — 1) — 0,20771 x 107? 
+0,032643 y(k — 1)* — 0,054208 y(k = 2)? + 0,0231193 y(k — 3)2. 
(10,32) 


*Aguimne; Bitinos, 1995. 
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O modelo (10.32) pode ser representado conforme a Eq. 10.19 com 


cr o(l) = 1,4209, cro(3) = -0,41549, — ci0(2) = 0,012, 
con(3) = 0,11736, cs 0(1,1,1) = =0,04904, ca1(1,1,3) = 1,207, 
c01(3,3,2) = 0,252, co1(2) = —0,078346, — ca1(2,3,3) = —0,47759, 


c3,0(3,3,3) = —0,030695, c3,0(2,2,2) = 005843,  c21(2,2,3) = —0,39072, 
con(L1,2)=-1,0272,  c»1(2,3,1) =0,44085,  coo = —0,20771x 1072, 
cra(L,1) = 0,032643, cii(2,2) = —0,054208, c11(3,3) = 0,023113. 


Para os demais coeficientes, tem-se Cpm-p(*) = 0. Deve ser notado que os 
18 termos do modelo (10.32) foram selecionados dentre um conjunto de 84 
candidatos, usando-se a razão de redução de ruído (ERR) a ser definida no 
próximo capítulo. [a 


O conjunto de termos candidatos de um modelo polinomial NARX de 
grau é é a união de todos os agrupamentos de termos possíveis até o grau 
de não-linearidade £, ou seja, 


[todos os termos candidatos) 


U Nypum-p 


p=0..m 
m=0,... 


constante UM, U Qu UM, U Mu U... 
N2 U...U todas as possíveis 
combinações até grau 2. (10.33) 


Da Eq. 10.33 fica evidente que seria desejável eliminar alguns agrupa- 
mentos de termos dentre o conjunto candidato antes de escolher a estrutura 
de um modelo matemático, 

Formas de detectar quais agrupamentos são efetivos e quais não o são, 
ou seja, o uso de agrupamentos de termos em problemas de detecção de 
estrutura, serão discutidas no Capítulo 11, Procedendo dessa maneira, o 
conjunto de regressores candidatos pode ser significativamente reduzido. 
Isso, além de representar uma economia de tempo de computação, diminui 
as chances de obter modelos com características dinâmicas espúrias, um 
assunto que será tratado com mais detalhes nos próximos capítulos, 
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Exemplo 10.5.2. Coeficientes de agrupamentos de um modelo polinomial NARX 


Os coeficientes de agrupamentos do modelo (10,32) são 


zy = cro(l) + cro(3) ah c1,0(2) = 1,0234, 
Ly = c30(1,1,1) + c3,0(3,3,3) + c3,0(2,2,2) = —2,1305x 1072, 
Du = co1(3) + coa(2) = 3,9019x10-2, 


Byiy = con(1,1,3) +c (3,3,2) +ca (2,3,3) 
+c21(2,2,3) + c21(1,1,2) + c21(2,3,1) = —1,9184x 1073, 


Lo = 0,0 = —2,0771x 1073, 
By = co0(1,1) + c2,0(2,2) + c20(3,3) = 1,54771x 1053, 


que correspondem aos agrupamentos M,, Ns, Qu, Yy2u, No e Ny2, respec- 
tivamente. Os coeficientes de ordem d do modelo (10.32) são 


By = cro(l) E = c1,0(8), 
Ly = cro(2) By = ca (11,1), 
By = c3,0(3,3,8) By = c3,0(2,2,2), 


Eju = can(1,1,3) + con(1,1,2)  Loay = 2,1(3,8,2), 
Eyayu Es co1(2,3,3) +c (2,3,1) Bytu =0C]1 (2,2,3), 
Ey = 20(L1) By = co0(2,2), 
By e c2,0(3,9). 


Neste exemplo tem-se as seguintes expressões: Ny = Yy U Ny U Qys; 
Ma = Mp UM UMa; Mr = Pu U Mau U Pagou U May &, finalmente, 
Ny = Ma U Na U Na. [a 


Portanto, um agrupamento da forma N,pym-p é um conjunto de termos 
do tipo y(k—i)Pu(k — j)"=P para m=0,... Le p=0,... ;m,e os respectivos 
coeficientes, E ,pum-p, São O somatório dos coeficientes de todos os termos no 
modelo que pertencem ao referido agrupamento, É interessante notar que 
no limite, quando Tg — 0, todos os termos de um mesmo agrupamento se 
“fundem” num 66 e todos os coeficientes de agrupamentos tornam-se iguais 
a zero com a exceção de By que, no limite, é igual à unidade. Matematica- 
mente, tem-se 


Jimg,+0 By = 1, 
limy,-0 Dyrum-» =0, para todos os demais agrupamentos. 


d 
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10.6 Pontos Fixos 


O objetivo desta seção é estabelecer algumas relações entre a estrutura de 
modelos NARX polinomiais e seus respectivos pontos fixos, ou pontos de 
equilíbrio. Nesse contexto, os conceitos de agrupamento de termos e coefici- 
entes de agrupamentos são adequados para determinar não apenas o número 
de pontos fixos dos modelos, bem como sua localização e simetria. Como 
será visto nos próximos capítulos, essa informação será útil na determinação 
da estrutura de modelos não-lineares em situações onde há algum conheci- 
mento a priori bem como em problemas de recuperação de características 
estáticas do sistema original. 


10.6.1 Número de pontos fixos 


Os pontos fixos ou pontos de equilíbrio de um modelo discreto autônomo 
são definidos como aqueles pontos para os quais y(k) = y(k + i), 1 E Z. 
No caso de modelos não autônomos, pontos fixos podem ser definidos para 
valores constantes do sinal de entrada. Nesses casos, os pontos fixos satis- 
fazem y(k) = y(k + i), à € Z para um dado valor constante do sinal de 
entrada q = u(k) = u(k+i),i € Z. O ponto de partida na análise de siste- 
mas não-lineares envolve, muitas vezes, a localização e a caracterização da 
estabilidade dos pontos fixos do sistema utilizando-se modelos matemáticos. 

A seguir, os pontos fixos serão determinados para o caso autônomo, 
que é uma situação particular do caso não autônomo quando o sinal de 
entrada é considerado constante. Por outro lado, para determinar os pontos 
fixos do caso autônomo, a partir de um modelo não autônomo, basta fazer 
u(k—1) =0, i=0,1,... Assim, todos os agrupamentos de termos possíveis 
de um modelo polinomial NARX com grau de não-linearidade £ são Ny = 
constante, M,, M2,..., Ne. 

Portanto, os pontos fixos de um modelo polinomial NAR (autônomo) 
com grau de não-linearidade £ (ver Egs. 10,19 e 10.20) são as raízes do 
seguinte polinômio “agrupado”; 

ny Myalhy 

ulk) = cos + v(k) 5 crolm) + ul? SO exo(mina) + «e 
n=) TR! 
Nyoly 


+ uh)! 3 ceo(ma,... me), (10.94) 


Mame 


sendo que foi usada a definição de pontos fixos. Usando-se também a defi- 
nição de coeficientes de agrupamentos de termos e omitindo-se o argumento 
k, a Eg. 10.34 pode ser reescrita como 


Dev +... +Dpy +(B,-Dy+Z0=0, (10.35) 
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sendo Do = co,0 uma constante. Da Eq. 10.35 fica claro que um modelo 
polinomial NAR com grau de não-linearidade £ terá £ pontos fixos somente 
se By *% 0. Em muitos casos práticos Do = coo = O e, neste caso, a 
Eq. 10.35 pode ser reescrita como 


(Bv +... +EZay+(By=D]y=0. (10.36) 


A Eq. 10.36 mostra que o modelo dinâmico correspondente tem um pon- 
to fixo trivial e £ — 1 pontos fixos não triviais. 


10.6.2 Localização de pontos fixos 


A localização de pontos fixos da parte autônoma de modelos do tipo (10.19) 

pode ser descrita em termos dos coeficientes de agrupamentos de termos 

Do, By, à = 1,... )! usando-se a Eq. 10.35. A álgebra necessária é bá- 

sica, apesar de tediosa. Portanto, no que se segue, alguns resultados são 

simplesmente apresentados na sua forma final, em vez de desenvolvidos. 
Os pontos fixos de um polinômio linear (£=1) são dados por 


1. Do 
j= = (10,37) 
Para polinômios quadráticos (L=2), os pontos fixos são dados por 
o 1-B, +VÃ 
diz = CaBa (10.38) 
A = (E-12-4DpDo. (10.39) 


Os pontos fixos de um modelo polinomial cúbico (£=3) são 


ii = (A+ 42) -Dy/(3E,3), 


a = -0,5(As+A2)-Dy2/(32,3) tj V3(Ag— Ao)/2, (10.40) 
sendo j=V-1 e 
A = V3M2,-12, — (E,-1)2D,2 — 18(2,-1)EoB,2E,s 
+27 0a + 4BoBja]º"/ ja, 
A = [E(2y-1)/622, — Do/22,5 — Dês/2705s — A f18'/8, 
As = [Ba(2y-1)/62)s — Eo/2Lys — Eja/27Eja + AM [18]! (10.41) 


Para £>4, as Egs. 10.35 ou 10.36 podem ser resolvidas numericamente. 
De fato, em muitos casos bastará obter os pontos fixos de forma numérica. 
Isso € feito com grande facilidade por vários programas de computador 
atualmente disponíveis, 
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Exemplo 10.6.1. Pontos fixos de um modelo polinomial NARX 


Tomando os coeficientes de agrupamentos calculados no Exemplo 10.5.2 
e substituindo-os nas Eqs. 10.40 e 10.41, os pontos fixos do modelo (10.32) 
podem ser facilmente calculados como sendo (1,150; -1,155; 0,078). Pelo 
fato de o agrupamento Ns ser o agrupamento do sinal de saída de mais 
alto grau, e porque Do £ 0, a versão autônoma do modelo (10.32) tem três 
pontos fixos não triviais, como já era esperado. [a] 


Deve ser notado que, para modelos com £ < 4 e Zo = 0, fórmulas 
semelhantes podem ser desenvolvidas para determinar os £— 1 pontos fixos 
não triviais. Portanto, modelos polinomiais lineares com Do = O somente 
têm o ponto fixo trivial. Modelos quadráticos com Lo = O têm o ponto fixo 
trivial, além de um ponto fixo não trivial dado por 


1-2 


ri 


y= 


(10.42) 


Modelos polinomiais cúbicos com Bo = O têm o ponto fixo trivial, 9 =0, 
e dois pontos fixos não triviais que podem ser determinados usando-se 


: -Dp VÃ 
dos = TAB (10.43) 
A = Bp-4B4(B,-1). (10.44) 


Finalmente, modelos polinomiais quárticos com Do = O têm um ponto fi- 
xo trivial, 1 =, e três pontos fixos não triviais, (72,73,74), dados pelas 
seguintes expressões: 


TZ) 
Talk) 


(Ag + Ag) — Dys/(32,), (10.45) 
—0,5(A3 +42) -D,3/(32,4):j V3(As — Ao)/2, (10.46) 


sendo que 


A = V3MLuDy- EhE, — 18(B,-1BpD By 

+27(Ey= 12 Eja + (By = DESP ER, (10.47) 
A, = (BoLy/0L7 — (By — 1/22, — ES [2788 — As /18]!º, (10.48) 
A = (EyBy/6Ej — (By — 1/22, — E$s [278% + Ai [18] 1/8, (10.49) 
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10.6.3 Estabilidade de pontos fixos 


Dado um modelo polinomial do tipo (10.19), é possível determinar anali- 
ticamente a matriz jacobiana correspondente. Em particular, um mode- 
lo polinomial NAR de ordem ny pode ser representado como um mapa 
f: IR" > IR” da seguinte forma: 


y(k) = S(y(k — 1)), (10.50) 


sendo que y € IR» é o vetor de estado, que, no caso de modelos NARX, é 
constituído de valores atrasados da variável de saída. O espaço definido por 
(10.50) é conhecido como o espaço de coordenadas de atraso. É importante 
notar que, para modelos não-lincares, a Eq. 10.50 pode ser matematicamente 
representada como 


0 5 Kia 0 
ylk=ny+1) 0 0 ts 0 y(k=ny) 
y(k=n,+2) ulk=ny+1) 


0 do am A 
v(k) h h IA y(k=1 
ulkn,)  ulk-ny+i) Cor ulh=) ( ) 


(10.51) 


sendo f;/y(k — 1) =0 se fj(:) não incluir y(k — à). Deve-se notar também 
que a matriz em (10.51) pode não ser única (ver Exercício 10.7). Em outras 
palavras, há diversas funções fj(:) tais que y(k) = fi + fo +... + fny- Por 
outro lado, a matriz jacobiana de f é 


0 l 0 Er 0 
0 0 1 Sa 0 


Df= $ : É E f (10.52) 
0 0 0 pia 1 
a JJ of of 
'y v Oy vt y(k=ny+2) tt y(h-1 
e é única. 


A determinação da matriz jacobiana nos pontos fixos de um modelo po- 
linomial é um procedimento útil para estudar a auto-estrutura (autovalores 
e autovetores) de tal modelo. Isso pode ser alcançado de forma analíti- 
ca e relativamente simples para modelos polinomiais e racionais NARX, A 
estabilidade de sistemas lineares, não-lincares e com atraso, foi estudada 


respectivamete em (BHAYA, 2007; BRETAS et al., 2007; GOMES DA SILVA; 
Leite, 2007). 
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Exemplo 10.6.2. Modelo polinomial NARX em espaço de estados 
Considere-se a parte autônoma do modelo (10,32), ou seja, assume-se 


que não há entrada, u(k — 3) = 0, Yj,k. O resultado é um modelo NAR, 
que pode ser colocado na forma (10.51) da seguinte maneira 


y(k—2) 0 l 0 u(k—3) 
| y(k-1) | = | 0 0 1 | | u(k=2) | (10.53) 
v(k) vê véio mb ) Lvl) 


sendo (ver Exercício 10.9) 


h 2 
= + — 0,030695 y(k — Lo 
T=3) 0,41549— 0 u(k— 3)? +0,023113 y(k — 3) 
fa 2 
2 = 0,012+0,05843y(k-2)? — 0,054208 y(k — 2 
mk) y(k—2) uk = 2) 
fa 2  0,20771x10-2 
= 1,4269 — 0,04904 y k-1) — > + 0,0320643 y(k — 
ulk=—1) “ vlk=1) ) v(k=1) 


[a 


Exemplo 10.6.3. Auto-estrutura de um modelo polinomial NARX 


Avaliando a matriz jacobiana do modelo (10.32), como indicado pela 
Eq. 10.52, nos pontos fixos calculados no Exemplo 10.6.1, percebe-se que 
tais pontos fixos são dois focos e uma sela, respectivamente. Mais especifi- 
camente, os autovalores da matriz jacobiana do modelo (10.32) são -0,601 e 
0,942:70,185 no ponto fixo 1,150 (foco instável); -0,602 e 0,94250,188 no 
ponto fixo -1,155 (foco instável) e -0,506, 0,824 e 1,079 no ponto fixo 0,078 
(sela). 0 


10.6.4 Simetria de pontos fixos 


Modelos polinomiais quadráticos com Do É O têm dois pontos fixos não 
triviais que são simétricos com respeito à origem se Dy = 1 e, nesse caso, os 
pontos fixos são dados por (ver Eq. 10,98) 


= 80r (10.54) 


A condição By = 1 será satisfeita se e somente se o modelo polinomial 
incluir um integrador, ver Complemento 10,4, 
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Os pontos fixos de modelos polinomiais cúbicos, (=7),0,5), são as soluções 
de um polinômio agrupado, como mostrado na Eq. 10.35, Dos resultados 
descritos na seção 10.6.2, torna-se claro que, a fim de se ter os pontos fixos 
(=5.0,5), o polinômio agrupado deve ter Do = O para garantir um ponto 
fixo trivial e B;: = 0 para garantir simetria (ver Eq. 10.43). Portanto, o 
modelo dinâmico correspondente não deve conter termos pertencentes aos 
agrupamentos Mo e N,2. Nesse caso, os pontos fixos simétricos são 


(10.55) 


Resultados análogos podem ser obtidos para modelos polinomiais de 
ordem mais elevada, conforme mostrado na Tabela 10.1. Essa tabela mostra 
quais são os agrupamentos de termos que podem estar representados num 
modelo a fim de que tal modelo tenha pontos fixos simétricos. 


TABELA 10.1: Agrupamentos de termos necessários para simetria 


Agrupamentos de termos dos quais os regressores de um modelo polinomial 
NAR(X) devem ser escolhidos de forma a se ter pontos simétricos e o número 
indicado de pontos fixos triviais. 


número de pontos 
fixos triviais 


t agrupamentos de termos 


permitidos no modelo 


1 l Ny 

2 0 Ny, No 

3 l Ns, Ny 

4 0 Ny Nya, No 

4 2 Na, Vy? 

5 l Ms, Ny, Ny 

5 3 Nys, Ny 

6 0 No, Nyt, Ny, No 
6 2 No, Qt, Ny 

6 4 No, Ná 


Fonte: (Aguinne; MENDES, 1996). 


A última coluna da Tabela 10.1 mostra que, sempre que for desejado 
ter pontos fixos não triviais e simétricos em relação a um número fmpar 
de pontos fixos triviais, não pode haver no modelo termos pertencentes aos 
agrupamentos fg ou 9),2. 


seg 
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Exemplo 10.6.4. Simetria de pontos fizos 


A fim de ilustrar a informação na Tabela 10.1, considere a conhecida 
equação logística y(k) = Ay(k — 1) — Ay(k — 1)? que não tem pontos fixos 
simétricos (ver Exercício 10.4). O fato de que tal equação não tem pontos 
fixos triviais pode ser constatado a partir da Tabela 10.1, notando que 
polinômios quadráticos terão pontos fixos simétricos se Do £ 0, Ly =0 e 
E, 0. Para a equação logística é claro que Do =0, B=A e Ep=-. 
Por outro lado, a equação logística ímpar y(k) = Ay(k — 1) — Ay(k — 1)? 
tem Do=0, Dy=A D,2=0 e By =-Ae, de acordo com a terceira linha da 
Tabela 10.1, essa equação tem pontos fixos não triviais simétricos em torno 
de um ponto fixo trivial. fa] 


10.7 Complementos 


Complemento 10.1. Modelos polinomiais NARMAX MIMO 


O modelo (10.18) pode ser também generalizado para o caso multivariável, 
como se segue: 


Y(k) = Ply(k=1),ecsy(k = myu(k = 1), su(k — nu), 
e(k — 1), ,e(k — ne)] + e(k), (10.56) 


sendo F[.] uma função vetorial qualquer e 


n(k) u(k) at) 
y(k) = dd jul) = rio e(h) = im (10.57) 
Um(k) ur(k) em(k) 


são os vetores de saída, entrada e ruído, respectivamente, m é o número de 
saídas, 7 o número de entradas. O fato de (10.56) ser multivariável com m 
saídas quer dizer que tal modelo pode ser escrito como m equações escalares, 
uma para cada subsistema, como se segue: 


ih) = Filgn(k — 1), qn(k — nine Um(k — 1),º+* sym(k — nim) 
n(k = Dye al = nie sur (RD) ur(k — mio), 
es(k = 1), sei(k — nbs), + sem(k = 1),::» sem(k — nim) + 
elk)i= cm, (10.58) 
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sendo que os máximos atrasos podem variar de subsistema para subsistema. 
Note que no caso multivariável qualquer variável de qualquer subsistema 
pode ser utilizada para compor o modelo de qualquer subsistema. Va- 
le mencionar que um modelo do tipo (10.57) é MIMO, mas sem = 1 0 
modelo seria MISO e, apesar de multivariável, uma única equação esca- 
lar seria necessária para representá-lo, pois modelos MISO têm apenas um 
subsistema. 

No caso de F[:) ser aproximado por uma função vetorial polinomial de 
grau é tem-se para o i-ésimo subsistema 


Mr M Mr 
vilk) = 00 + 55 hm (6) + DD DO Ohagta (B)za(h) + 
ú=1 i=liz=iy 
Me Mr, j 
4550 DD Arizilh) eee mil) ek), i=1,;m, (10.59) 


ú=1  itsita 


para i = 1,... ;m, sendo que 0; são os parâmetros a estimar, z; os monômios 
que compõem os regressores, y; a saída do i-ésimo subsistema e e;(k) é o 
erro da equação de regressão desse subsistema, e Mp = m(ny+ne) +T Xu. 

Um aspecto importante a observar sobre a representação (10.58) é que 
cada saída y;(k) pode ser explicada por um conjunto diferente de variáveis 
regressoras, que são as variáveis independentes de cada uma das funções 
Fil:). No Complemento 2.2 foi descrita uma representação vetorial (VARX) 
em que o conjunto de variáveis regressoras é o mesmo para todas os ele- 
mentos do vetor de saída. A vantagem de se considerar o mesmo conjunto 
de variáveis é que permite visualizar as interdependências entre as diversas 
variáveis do modelo. A desvantagem é o aumento do número de parâme- 
tros. Recentemente foi observado que em termos de desempenho dinâmico 
as duas representações são muito semelhantes (BAGARINAO; SATO, 2002). 

Como será visto no Capítulo 11, o caso multivariável MIMO pode ser 
tratado de forma análoga ao caso monovariável, Uma grande diferença é que 
o número de possíveis regressores aumenta ainda mais com relação ao caso 
monovariável, Entretanto, tendo definido qual será a estrutura da equação 
de um determinado subsistema, o mesmo estimador do caso monovariável 
pode ser utilizado, Por outro lado, modelos vetoriais lineares ou não — 
V(NJAR, V(N)ARX, e assim por diante — requerem algoritmos específicos. 


1 
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Complemento 10.2. Estimação de derivadas 


Dado um sinal y(t), em muitas situações é de interesse poder estimar 
suas derivadas y(t), y(t) e assim por diante. O uso de aproximações sim- 
ples, tais como as Eqs. 1.39 e 1.40, normalmente não é adequado na prática, 
tendo em vista que dados reais contêm ruído. No que se segue, será descrito 
um procedimento simples e bastante efetivo para a estimação de derivadas 
de sinais temporais. As derivadas necessárias para obter os resultados des- 
critos nos exemplos das Seções 16.2 e 16,11 foram estimadas seguindo-se o 
procedimento descrito a seguir. 

Seja um sinal amostrado y(k). Primeiramente, deve-se obter uma apro- 
ximação polinomial gn do sinal de interesse numa (normalmente estreita) 
janela de tempo. Matematicamente, tem-se 


vlk) = gn, hSk< kr (10.60) 


sendo n o grau do polinômio gn, e k;, kr os índices correspondentes ao início 
e fim da janela de dados onde a aproximação está sendo feita. Obviamente, 
9 poderia ser qualquer tipo de função algébrica capaz de aproximar o sinal 
v(k) no intervalo [ki, kf). No presente desenvolvimento, apenas aproxima- 
ções polinomiais do tipo 


gn=00+0k+... tank! + ank" (10.61) 


serão consideradas. A fim de obter gn, os coeficientes a; em (10.61) devem 
ser estimados. Para isso, pode ser seguido um procedimento análogo ao 
descrito nas Seções 5.2 e 5.3. Assim, a equação de regressão a ser usada é 


v(k) = co +mk+...+an-ht! + ank" + e(h), (10.62) 


para k; < k < k e sendo e(k) o erro de regressão. Portanto, tomando-se 
kr —-k+ 1 restrições a partir da equação de regressão (10.62) chega-se à 
seguinte equação matricial; 


[or 
u(ki) Loba kpot [o q 

pois Ed (10.63) 
ulkr) Ih RO RI] nai 
Qn 

y = X0. (10.64) 


Como visto no Capítulo 5, o vetor de parâmetros 8 pode ser determinado 
calculando-se 8 = [XX]! X”y, que é o estimador MQ de 0. 
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Finalmente, as estimativas das derivadas de y(k) podem ser obtidas 
derivando-se (10.61) analiticamente e avaliando as funções resultantes no 
ponto de interesse, ko, ou seja 


dg 


ko) = e =ô+...+(n-1)ân-kp? + nânkio! 


k=ko 


= âo+..+(n-2)(n-1)ân-1kp+(n—1)nânkpo? 
k=ko 


EIN gn 
Ulho) = a 


e assim por diante, 

Deve ser notado que no procedimento acima a derivada de maior ordem 
que pode ser estimada é limitada pela ordem do polinômio estimado, n. 
Na prática, ko é escolhido no meio da janela [k;, kr] cuja largura não deve 
ser muito grande, É comum aproximar y(k) ao longo de uma janela de 5 
ou 7 intervalos de amostragem. Assim, se for desejado estimar 1)(45), por 
exemplo, é comum ajustar um polinômio de ordem 2 ou 3 à janela de da- 
dos [y(42) y(43) y(44) y(45) y(46) y(47) y(48)). Finalmente, é ressaltado 
que o intervalo de amostragem tem grande influência na qualidade das de- 
rivadas estimadas, sendo que maiores valores de fregiiência de amostragem 
normalmente resultam em melhores resultados. 

Evidentemente, há outras formas de estimar derivadas, como, por exem- 
plo, os filtros de estado. Tais filtros podem ser implementados digitalmente 
para a estimação de derivadas em situações reais (CAMARGO, 1997). 


Complemento 10.3. Estimação de pontos fizos a partir de dados * 


O procedimento a ser descrito a seguir consiste basicamente de duas 
etapas que são efetuadas diversas vezes ao longo de uma janela que percorre 
os dados. Na primeira etapa, apenas um número limitado de parâmetros são 
estimados a partir dos dados. Na segunda, informação sobre agrupamentos 
de termos e localização de pontos fixos é obtida a partir de tais parâmetros. 
O procedimento completo é descrito a seguir: 


m 


. dada uma série temporal (j(k)J)”, normalize os dados dividindo cada 
observação pelo maior valor na série, ou seja, faça a seguinte divisão: 


(ul = (Dk) /max(õ(k)); 


. escolha uma janela de comprimento L < N tal que aproximadamente 
cubra a faixa de valores observados na série; 


[e] 


DD] ] 
*AguirRE; SOUZA, 1998. j 


= [ 
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3 faça ti =0; 


4. para a janela de dados (o monte a matriz W € RÉ” co 
vetor Y, conforme (10.65) e (10.66), respectivamente; 


5 calcule Ô = [WTW]-IWTy, o que corresponde a obter os parâmetros 
usando o estimador MQ; 


8. determine os coeficientes de agrupamentos Do, D,, Ly eD,. Coloque 
num gráfico os valores de tais coeficientes em função do índice da 
janela 1; 


7. determine os pontos fixos calculando as raízes do polinômio (10.35). 
Coloque num gráfico os valores de tais pontos fixos em função do 
indice da janela 1; 


S. atualize à = i+4A e volte ao passo 4 até atingir o fim da série temporal. 
à é o deslocamento, medido em número de amostras, entre a janela 
de uma iteração e a janela da iteração seguinte; 


9. baseando-se nos gráficos dos coeficientes de agrupamentos (passo 6), 
verifique se há agrupamentos espúrios (isto será detalhado no próximo 
capítulo, mas o Exemplo 10.7.1 ilustra o procedimento). Se nenhum 
agrupamento parece ser espúrio, então a localização dos pontos fixos 
pode ser lida diretamente dos gráficos, por exemplo tomando-se o valor 
médio. Multiplique os valores obtidos por max(j(k)) para desfazer 
a normalização efetuada no passo 1. Se a análise dos gráficos sugerir 
que há agrupamentos espúrios, elimine tais agrupamentos da matriz 
Y (isto equivale a eliminar as respectivas colunas) e volte ao passo 4. 


A normalização feita no passo 1 facilita reconhecer agrupamentos espú- 
rios, que se evidenciam por coeficientes de termos pequenos ou oscilatórios 
estimados e mostrados em forma gráfica no passo 6, 

A condição L < N, no passo 2, garante que a janela de trabalho possa 
ser deslizada ao longo de toda a série temporal, Na prática, N > L > 200 
funciona bem, em geral, 

Deve ser notado que a matriz (10.65) inclui apenas um número pequeno 
de regressores possíveis, ou seja, ny é normalmente pequeno (tipicamente 
menor que 15). Uma das características do presente algoritmo é que os 
pontos fixos estimados não são sensíveis aos multinômios (regressores não- 
lineares) que estão sendo usados para compor as £+ 1 colunas de Y. 

Se, por um lado, a escolha de £ determina o número de pontos fixos que 
serão estimados, por outro, a escolha de como compor as colunas de Y é 
menos importante. Tal matriz pode ser representada, de forma geral, como 
se segue: 
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Do y(k=1) o ylk=-m) n(k=1)? 
Do y(k+1=1) .  y(k+I-ny) u(k+1-1)2 


LOMBAL=1-1) 0. p(b+L=1-m) p(RAL=-IP 


ylk=naP o u(=DE o (km! 
ulk+I-na) o y(R+AI=DO o u(k+I me! 
; ; : ; j (10.65) 
ylk+L=1-n9)? ... y(k+L=1-18 ... u(k+L=1-n9! 


Na matriz acima, a faixa de regressores (y(k —1)*... y(k —n4)*) indica 
todas as possíveis combinações dos monômios (y(k — 1) ... y(k — ne)) 
agrupados em potências de , ou seja, o regressor y(k — 1)y(k — 2) está 
contido em (y(k — 1)2 ... y(k — n2)?). Como mencionado acima, nem 
todos os regressores serão necessários na prática, como será ilustrado no 
Exemplo 10.7.1. O vetor y é formado como se segue: 


y=[y(k) ulk +)... uk +L= 1]. (10.66) 


O presente algoritmo é bastante robusto ao ruído devido ao estimador 
MQ usado na estimação dos parâmetros, Apesar de o ruído poder, em 
alguns casos, induzir polarização na estimativa dos parâmetros, os pontos 
fixos permanecem com seus valores relativamente inalterados (ver Exercí- 
cio 10.6). Obviamente, é possível escolher um dentre os estimadores não 
polarizados descritos no Capítulo 7 para se evitar a polarização nos pará- 
metros. Devido a tais características, quando comparado criticamente com 
outros algoritmos disponíveis, o presente método foi considerado o mais in- 
dicado quando apenas uma série temporal estiver disponível (Rot, 2002). 

Finalmente, vale mencionar que o passo 9 pode ser visto como um ajuste 
fino ao procedimento, Mesmo quando esse passo não é executado, boas 
estimativas dos pontos fixos são obtidas. Mas se agrupamentos espúrios 
são reconhecidos e eliminados, será obtida maior precisão e exatidão na 
estimativa dos pontos fixos, 


Exemplo 10,7.1. Pontos fizos estimados de dados reais 4 


No presente exemplo, o procedimento descrito acima será usado para 
estimar os pontos fixos de um oscilador eletrônico a partir de uma série 
temporal medida. A matriz W foi originalmente composta pelos seguintes 
regressores: constante, y(k — 1), y(k — 2), y(k — 3), y(k — 4), y(k — 1)8, 

“AguirRE; SOUZA, 1998. 
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VA =D, ul = Dyk = 2), u(k = 3)y(k = 4), Dk = 13, uk = Dyk = 273, 
vit = 3) e y(k — Dy(k — 2)y(k — 3), portanto no = 13. Tais termos foram 
selecionados de forma bastante arbitrária, Á única precaução foi garantir 
que, na primeira iteração, Y incluísse regressores de todos os agrupamentos. 
O primeiro conjunto de dados considerado foi o atrator dupla-volta mos- 
trado na Figura 16,2. A série temporal original tem N = 5.000 valores 
amostrados com T; = 2us. Nesse caso escolheu-se L = 900 e A = 5. Os 
pontos fixos estimados com a matriz Y incluindo todos os agrupamentos 
foram: (=2,25 + 0,02; 0,03 0,13; 2,15 0,02) V (ver Figura 10.5). 


Ea 


pontos fixos estimados 
1 
Lo 


-2 
: 
4 
Lil. hm 


' 4 gd 
100 200 300 400 500 600 700 800 
número de iterações 


o 


FiGuRA 10,5: Pontos fixos do atrator dupla-volta 


Pontos fixos estimados a partir de dados do atrator dupla-volta 
dsvci O, As linhas tracejadas indicam a faixa em que se encon- 
tram os dados medidos. 


A Figura 10,6 claramente revela que os agrupamentos Ng e N,: são 
espúrios, uma vez que não são significativamente diferentes de zero se com- 
parados aos demais coeficientes de agrupamentos. Essa informação poderia 
também ser obtida a partir da Figura 10,5 e da Tabela 10,1. Observando- 
se a Figura 10,5, o sistema parece ter um ponto fixo trivial e dois pontos 
fixos não triviais simétricos, Da terceira linha da Tabela 10.1 percebe-se 
que apenas os agrupamentos Ny e Na são efetivos no presente caso. Por- 
tanto, eliminando-se as colunas de Y correspondentes aos agrupamentos 
espúrios Mo e Ny, os seguintes pontos fixos simétricos foram estimados: 
(42,20 + 0,01; 0,00) V. 
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A seguir, 3.000 observações foram tomadas do atrator espiral do mesmo 
oscilador eletrônico, mostrado na Figura 16.3 (spivci O). Os seguintes 
valores foram usados Ts = 208, L = 900 e À = 5. 


o! da 15 
005 

0 1 
-205 

“lg "200 400 60 800 os, 


(b) 


(e) (a) 
o 05 
[e 
[) [) 
-005 | 
-Dig——200 400 60 80 “085200 400 60 800 
número de iterações número de iterações 


FIGURA 10.6: Coeficientes de agrupamentos do atrator dupla-volta 


Coeficientes de agrupamentos estimados a partir de dados sobre 
o atrator dupla-volta dsvci O. (a) Do, (b) Dy, (c) Ey2, (d) Lys. 


A Figura 10,7 mostra os pontos fixos estimados utilizando-se todas as 
colunas da matriz WY. Como pode ser observado, a variância de um ponto 
fixo é muito maior do que a dos demais, além de os valores estimados es- 
tarem fora dos limites dos dados (aproximadamente -6 e 0). Baseando-se 
nessa observação, pode-se concluir que o algoritmo pode estimar correta- 
mente apenas dois pontos fixos e, portanto, as colunas 10 a 13 de Y (que 
correspondem a 94,3) devem ser removidas, Fazendo-se isso, os seguintes 
pontos fixos foram finalmente estimados: (—3,65 + 0,02;0,00) V. [8] 


Complemento 10,4, Modelos discretos com integração 


Para o caso linear, considere o seguinte modelo: 


nt) = Donlk-045 bulk-s) 
iz] i=l 
Ala ylk) = Blg)u(k). (10.67) 
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FIGURA 10.7: Pontos fixos do atrator espiral 


Pontos fixos estimados a partir de dados do atrator espiral. As 
linhas tracejadas indicam a faixa em que se encontram os dados 


medidos. 


Modelos lineares, como (10.67), têm apenas os agrupamentos Ny e Qu. 
Tomando-se a transformada Z de (10.67) e expressando-se os polinômios 
resultantes em termos da variável z, obtém-se y(k) = B(z)u(k)/A(2z). En- 
tão, tem-se o seguinte resultado: 


Lema 10.7.1. (AGUIRRE, 1994). Dado o modelo (10.67), então By = 1 
se e somente se A(z) tem uma raiz em z =1. 


Demonstração. 
Primeiramente, será provado que se A(z) tem uma raiz em z = 1, então 
£y = 1. Considere os seguintes polinômios e o somatório de seus coeficientes 


até a potência n — 1: 


(2+m)) > a = [01], 
(2+a)l2+a) > Di=<a> +09] + (0109), 
(z+a)le+as)lz+as) > Di=<a>+<a>+ <a> +[as), 
+(mas) + (azas) + (orazas), 


sendo que os índices indicam a ordem do respectivo polinômio. 
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O seguinte padrão é evidente: i) os termos entre < > são copiados do 
passo anterior, ii) os termos entre [] são os novos termos acrescidos a cada 
passo e iii) os termos entre ( ) são o produto dos termos entre < > e os 
termos entre [] do corrente passo. Logo, DB" pode ser determinado como 


Dm =<2-1> +an] + (El lan). (10.68) 

Está claro que —B" é o coeficiente de Ny, para o modelo (10.67) com 
A()=(2+m)(2+02)...(2z+an). (10.69) 

Logo, BR=-D,. A Eq. 10.68 pode então ser reescrita da seguinte forma 
-Dy=[L+an]2R! + an. (10.70) 


Se A(z) tem uma raiz em z = 1, então q; = —1 para i € [1,2,...,n). 
Sem perda de generalidade, assume-se que qn = —1, e da Eq. 10.70 segue-se 
que Dy=1. 

Finalmente, será mostrado que se Ly=1, então A(z) terá uma raiz em 
z=1. Se By=1, a Eq. 10.70 pode ser reescrita como se segue: 


(10.71) 


Claramente, se bia * —1 então qn = -1, o que significa que o último 
fator na Eq. 10.69 corresponde a uma raiz de A(z) em z=1. Se an £-1, 
isso necessariamente requer que Dt-!=-1. D%-1 é o coeficiente de Ny para 
um polinômio de ordem (n—1) análogo a A(z). Assim, 


BR? +1 
Qn-1 =—">5— 10.72 
n—l 21 41 ( ) 
e a prova é completada seguindo o mesmo raciocínio usado anteriormente. 
(| 


A extensão do Lema 10.7.1 para modelos NARX baseia-se num modelo 
de Volterra de n-ésima ordem e na transformada multidimensional de tal 
modelo (PEYTON-JONES; BILLLINGS, 1989). A variável independente de 
tal modelo é um vetor de fregiências w=w,... ;Wn OU Z=21,... Zn Se O 
modelo for representado usando-se a transformada Z. Devido à especifici- 
dade dos conceitos necessários para demonstrar o lema a seguir, ele somente 
será enunciado. 


Lema 10.7.2. (AGUIRRE; BILLINGS, 1995). A transformada Z da resposta 
em fregiiência não-linear total de um modelo NARX, HRS (eli), é obtida | 
substituindo-se e!“ por x. A função resultante, H$SY"(z;), terá um pólo 

emz=1, isto é, (z))b, =1 se e somente se By=1. | 


o 
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Deve ser notado que os Lemas 10.7.1 e 10.7.2 são verdadeiros para qual- 
quer período de amostragem. Além disso, tais lemas também são válidos 
para modelos autônomos, ou seja, modelos AR e NAR. 

O Lema 10.7,2 é consistente com o fato de que os pólos de uma função 
de transferência de n-ésima ordem são determinados apenas pelos termos li- 
neares da saída de um modelo NARX (PeYTON-JONES; BILLLINGS, 1989). 
Em outras palavras, tais pólos são determinados exclusivamente pelos ter- 


mos do agrupamento 12. 


Complemento 10.5. Características estáticas de modelos polinomiais NARX 


No presente complemento será considerado o caso em que o sistema em 
estudo possui uma característica estática não-linear. Por característica es- 
tática entende-se a relação algébrica que existe entre as variáveis de entrada 
e saída do sistema em regime permanente. 

Matematicamente, sejam 7 e ú os valores (constantes) da saída e entrada 
em regime permanente para um dado sistema. Portanto, pode-se escrever 
y = f(ú), ou seja, se for aplicado um sinal constante i na entrada de um 
sistema assintoticamente estável, após atingir o regime permanente, a saída 
do sistema alcançará o valor j = f(ii). No caso de sistemas lineares é fácil 
perceber que a relação acima torna-se j = K'iú, sendo que K é o ganho 
(constante) do sistema. 

Uma expressão geral para o ganho estático de modelos polinomiais 
não-lineares pode ser escrita utilizando-se os conceitos de agrupamento de 
termos e seus coeficientes (ver Seção 10.5) como 


= Do/ã + Di + Dto Bum! 
= TE Lit 7 ar 
1-Dy -— Lm=1 DT yum pr tum — Spa Dypr 


K=: (10:73) 


Para sistemas com ganho variável, a característica estática f(.) não será 
uma constante. Isso caracteriza um sistema não-linear. Deve ser notado 
que esta análise é análoga à análise de pontos fixos feita na Seção 10.6 
para o caso autônomo. Note que 7 pode ser considerado o “ponto fixo” do 
sistema não autônomo excitado por ú, Portanto, a análise de um modelo 
polinomial NARX em regime permanente excitado por um sinal constante 
equivale a fazer ú = u(k —i) ey = y(k — i), Vi, na equação do modelo. Isso 
resultará em uma equação algébrica que descreve a relação estática entre as 
variáveis de entrada e de saída. Dependendo dos agrupamentos presentes 
em um modelo polinomial NARX, não será possível escrever j = f(ã) (ver 
Exercício 10.10). Apesar de contornável numericamente, o problema de não 
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poder expressar a característica estática como j = f(ã) pode normalmente 
ser evitado, como será ilustrado nas Seções 16,4 e 16.6. 

A capacidade de poder recuperar a característica estática de um giste- 
ma a partir de dados, via um modelo, é interessante por duas razões. Em 
primeiro lugar, como será discutido no Capítulo 11, se um modelo deve re- 
presentar uma característica estática do tipo j = f(d), isso impõe restrições 
na sua estrutura. Se bem aproveitadas, tais restrições podem ser úteis na 
etapa de determinação de estrutura. Quando existir conhecimento prévio, 
como, por exemplo, a forma da função f(:), poderá ser aproveitado para 
melhor escolher a estrutura do modelo, como será visto no Capítulo 15. Em 
segundo lugar, se por meio de modelos for possível estimar uma função algé- 
brica que descreva como o ganho do sistema varia com, por exemplo, o ponto 
de operação, é possível, pelo menos em princípio, utilizar tal informação no 
projeto de sistemas de controle mais eficazes. 


Exemplo 10.7.2. Características estáticas de modelos ARX e NARX 


Considere os seguintes modelos de um pequeno sistema de aquecimento 
elétrico obtidos a partir de uma massa de dados (mydin2 O) reais medidos 
durante um teste dinâmico aplicado ao sistema: º 


vlk) = 13817y(k=1) + 0,041 u(k—1) — 0,4296y(k—2) 
—0,0077 u(k — 2) + E(k), (10.74) 


y(k) = 1,3920y(k=1) + 0,0454u(k—1)2 — 0,4235y(k—2) 
—0,4388 y(k — 1)u(k—2) + 0,3756 y(k— 2)u(k—2) 
+0,0218 u(k—2)2+0,0097u(k— 1)u(k—2)-+E(k), (10.75) 


sendo que E(k) é o resíduo em cada caso, Ambos os modelos foram identi- 
ficados utilizando-se uma parte MA de forma a evitar polarização. Como 
será detalhado na Seção 16.6, a entrada u(k) é um sinal de tensão elétri- 
ca em volts, ao passo que a saída y(k) é um sinal em por unidade (p.u.) 
correspondente à temperatura, O estimador usado foi o EMQ, descrito na 
Seção 7.2. As características estáticas dos modelos (10.74) e (10.75), bem 
como do sistema que produziu os dados, estão mostrados na Figura 10.8 
(ver Exercício 10.11). 


*CASsINI, 1999. Ver também Seção 16.6. | 
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Figura 10,8: Características estáticas: medida e estimadas 


Características estáticas de um pequeno aquecedor elétrico, i é o 
valor em volts em estado estacionário da tensão elétrica da entrada 
ef 6o valor em pu. correspondente à temperatura atingida em 
estado estacionário. Característica estática (—) medida em teste 
estático, (+ -) do modelo linear (10.74) e (= : —) do modelo não- 
linear (10.75). 


Como pode ser observado, apenas o modelo (10.75) consegue reproduzir 
razoavelmente bem a característica estática não-linear do processo. Peque- 
nas diferenças, principalmente para valores maiores de temperatura, são em 
parte conseqiiência de diferenças de temperatura ambiente e humidade do 
ar entre os dias em que os testes, estático e dinâmico, foram realizados. 
Sugere-se ver também a discussão dos resultados descritos na Seção 16.6 
obtidos a partir do mesmo sistema. [a 


A seguir a característica estática será descrita em forma matricial. Esse 
tipo de representação será muito útil, como será visto no Capítulo 15. 

Voltamos a considerar sistemas assintoticamente estáveis. Para esses 
sistemas, fixando-se a entrada em um valor constante ú, a saída atingirá o 
valor constante 7. Em geral ii e estão relacionados por = f(7,ú), em que 
f(:) é a função estática. Para um modelo NARX polinomial geral, graças à 
linearidade nos parâmetros, é possível escrever (ver Exercício 10.14) 


Vi = (Didi) =q7S0,i=1,2,...,ns (10.76) 


Digitalizado com CamScanner 


408 10 REPRESENTAÇÕES NÃO-LINEARES 


sendo 
= Lt q... : 
qr= [1 Decl. Fu] Ena (10.77) 


em que Ryu representa todos os monômios não-lineares que envolvem y(k) 
e u(k); £ é o maior grau de não-lincaridade no modelo, e 


R=S6=([Doly.Dy Du Du Fo)", (10.78) 


em que Fy representa todos os coeficientes de agrupamento correspondentes 
a todos os agrupamentos de termos em F,y (ver Seção 10.5). Finalmente, 
S é uma matriz constante composta de zeros e uns, que faz o mapeamento 
entre o vetor de parâmetros e os coeficientes de agrupamentos. Assim, 
dado um modelo NARX polinomial, com vetor 8, a função estática pode 
ser descrita em forma matricial por (ver Exercício 10.15) 


y = QS0, (10.79) 
em que 
a 
Q= ko , (10.80) 
a 


sendo nsg o número de pontos em estado estacionário (;,7;) levados em 
consideração. Suponha que ns pontos de operação em estado estacionário 
(7;,9:) sejam conhecidos. Uma função que mede o desvio entre a função 
estática de um modelo NARX polinomial e os valores (i;,7;) é 


Jre(ô) = (7 = 5)"(7 — 5) = (7 — QS0)"(y — Q50). (10.81) 


Complemento 10.6, Função de autovalores de modelos polinomiais NARX 


Neste complemento serão desenvolvidas relações que ajudam a entender 
como os termos de um modelo polinomial NARMAX afetam os autovalores 
de linearizações do referido modelo em torno de pontos de operação. Uma 
extenção para redes RBF pode ser encontrada em (ALVES, CORRÊA, 2002). 
Para facilitar a apresentação, será discutido o caso de segunda ordem, mas 
a sua extensão para ordens elevadas é simples. 


Sejam y(k — 1),y(k — 2) variáveis de estado. Uma aproximação linear 
da Eq. 10.19 pode ser expressa como 


I "a | Eh l 4 1) ] + BU(A), (10.82) 
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em que U(k) é o vetor de entrada, B é a matriz de entrada e Dr é a 
respectiva matriz jacobiana. Como o modelo é de segunda ordem, tem-se 


Dix I Ma pi |: (10.83) 
em que 
Oy(k) 
As ML 10.84, 
“E Bylk=d) (0,9) em 


e d = 1,2 são os atrasos na variável y. 

Considerando-se u(k) uma entrada constante igual a ii e sendo j a res- 
pectiva saída em estado estacionário (à semelhança do que foi feito no Com- 
ento 10.5, os elementos Ag da matriz jacobiana podem ser obtidos 
usando-se (10.84) para cada ponto de operação, (11,7), como 


t tm 


Mali) = 55 55 0 Bygani Da, (10.85) 
m=0 p=0 


Os autovalores de Ds são por definição as raízes da sua equação carac- 
terística det|Dr — M| =, ou seja, 


X-AA-A=0. (10.86) 


Frequentemente, os coeficientes A; dependem de alguma variável do 
modelo (veja (10.90) abaixo). Nesses casos a Eq. 10.86 com (10.90) será 
referida como sendo a função de autovalores do modelo. 

É instrutivo distinguir entre os seguintes tipos de termos: i) termos com 
p=0em 0; ii) termos com m =0 e p 0, e iii) termos com m =p = 0. 
Portanto, se um modelo NARX somente tem termos com p= 0em £ O 
— o que corresponde a agrupamentos de termos que envolvem apenas a 
variável u —, ou seja, Qu, Quz, +++, Qut, à Eq. 10.85 se reduz a 


t 


Mali) = by» 0x Eygumii” = 0, (10.87) 
m=0 
Deve ser notado que os agrupamentos de termos Q, Na, ..., Mt não 


influenciam as raízes da Eq. 10.86 e, portanto, não afetam os autovalores do 
modelo linearizado. 

Se um modelo polinomial NARX somente tiver termos com m = 0 e 
p 0, que correspondem a agrupamentos de termos apenas na variável y, 
ou seja, My, My2, «++, Mt, à Eq. 10.85 pode ser reduzida a 
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t 
Aalú,g) = >» Egor, 
p=1 
ou 


A 
Auld) = yu + Do pEgio (10.88) 
p=2 


Como revelado pela Eq. 10.88, Aq, que é um dos coeficientes da equação 
característica (10.00); tem uma parte constante, Dy,, e uma parte variável, 
que é função de gP-!, Consegiientemente, a presença do agrupamento-d 
Dy com p > 1 em um modelo polinomial NARX implica que os autovalores 
dependem do sinal vo, 

Seguindo a mesma linha de raciocínio, se um modelo tiver termos dos 
agrupamentos-d Num, ou seja, termos com com m £ 0 ep £ 0, a Eq. 10.85 
pode ser reescrita como 


t t-m 
Aali,ã) = x» 32, pum Po O (10.89) 


m=1 p=1 


que indica que Ag, €, consequentemente, as raízes da Eq. 10.86, depende 
tanto de 9?! quanto de 7”, que, por sua vez, determinam o ponto de 
operação (1,9). 

Usando as Egs. 10,87, 10,88 e 10.89, a Eq. 10.85 pode ser reescrita como 


t t-m 


| 
| 
Dali) = By + Sp Epi! + 35 DEP» gun o! am | 
p=2 mz=I p=1 | 
ou de forma mais compacta 
Nr 
Mali) = dy + DD Aun d= 12, (10.90) 


i=1 ] 


sendo Ay, constantes que dependem dos coeficientes dos agrupamentos-d e À 
Z,, são os sinais dos quais dependem os autovalores. 

A Tabela 10.2 mostra como os agrupamentos-d e seus coeficientes afetam | 
A; na Eq. 10.86 e, portanto, revela como afetam os autovalores de Dr. 


ale d 
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TABELA 10.2: Agrupamentos-d e seus coeficientes 


Influência de todos os agrupamentos-d e seus coeficientes nos coeficientes, Ai('), 
da equação característica de modelos polinomiais NARX com (=2ed=2. O 
índice à é o mesmo da Eq. 10.90. 


FONTE: (AGUIRRE; CORRÊA; CASSINI, 2002). 


A título de exemplo, considere o modelo 


v(k) = cro(ly(k=1) + cop(1,2)u(k=1)u(k—2) 
+eo(1u2(k=1) + cr o(2)y(k—2) 
+eii(L2)y(k=—1)u(k-2) +11 (2,2) y(k—2)u(k—2) 
+eo2(2)u?(k—2), (10.91) 


que tem termos pertencentes aos seguintes agrupamentos-d: M, yu, 
Mar Yyruy Mu, sendo que By = cio(1), Pyu = c11(1,2), By = c10(2), 
Du = c11(2,2), By: = c0,2(1,2) + co 2(1) + co,2(2) são os respectivos coe- 
ficientes. Esses cinco agrupamentos aparecem nas linhas 1, 2, 7,8 e 9 da 
Tabela 10.2. Deve ser notado que a Tabela 10,2 corresponde a um modelo 
completo, ou seja, com todos os agrupamentos possíveis para = 2e d = 2. 
Portanto, considerando-se apenas a parte da Tabela 10.2 pertinente ao mo- 
delo (10.91) e a Eq. 10.90, os seguintes coeficientes da equação característica 
(10.86), que é uma função de %, podem ser facilmente obtidos 


Ai(Za,,) = Ly +Pyuil 
Liza) = Dy + Pyuil. 
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As linhas 3 e 9 da Tabela 10.2 confirmam que se um modelo não-linear 
somente tiver termos dos agrupamentos 2, j > 1, tal modelo é muito 
próximo de ser do tipo Hammerstein (ver Seção 10.2.2) e tem autovalores 
constantes. O estudo de caso da Seção 16.6 ilustra o uso da teoria aqui 
apresentada. 


Complemento 10.7. Características estáticas de redes RBF NARX 


A função estática pode ser inferida a partir de um conjunto de pares de 
valores da entrada e da saída tomados em estado estacionário e indicados por 


(Midi), à = 1,2,... ns. Substituindo y(k) = y(k-1)=--=y(k-ny) = 
eu(k=1)=u(k-2)=--=u(k— ny) = ú em (10.10), a função estática 
da rede RBF pode ser descrita como 
Ne 
(1-2) -0Bu-vo=> wó(ly es), (10.92) 


i=l 


em quey=[7...gú...u)” E IR? e os coeficientes dos agrupamentos 
de termos lineares são 


ny Ny 
= Da ME) (10.93) 
j=1 i=l 


No desenvolvimento da Eq. 10.92 considerou-se que o ruído e(k) em (10.10) 
tem média nula. Para cada valor da entrada em estado estacionário ú, 
os pontos fixos podem ser encontrados resolvendo-se a Eq. 10.92 para y 
ou, em outras palavras, buscando-se as soluções de uma equação do tipo 
7 = F(u,9), em que F(:) é a função estática não-linear do modelo. No 
caso particular em que ny = 0, o vetor Y E IR (ver Eq. 10.92) é consti- 
tuído somente de variáveis de entrada e, consequentemente, 7 E IR, pode 
ser encontrado de maneira analítica. Quando não for esse o caso, as solu- 
ções devem ser encontradas por algoritmos de busca de raízes de equações 
(Campos FiLHo, 2001) ou por simulação, sendo que nesse útlimo caso ape- 
nas as raízes estáveis podem ser encontradas, 


Leitura Recomendada 
Um dos primeiros artigos a tratar da identificação de modelos Hammerstein 


foi publicado por Narendra e Gallman em 1966. Uma boa revisão sobre mo- 
delos de Volterra, Wiener e Hammerstein aplicados à identifição de sistemas 


Digitalizado com CamScanner 


LEITURA RECOMENDADA 413 


pode ser encontrada em (BILLINGS, 1980). O uso dos dois últimos em mode- 
los híbridos foi abordado em (BiLLINGS; FAKHOURI, 1982). O uso de séries 
de Volterra aplicadas à identificação e controle de sistemas não-lineares foi 
abordado em (OLIVEIRA; AMARAL, 2000). Técnicas não-paramétricas line- 
ares e não-lineares incluindo séries de Volterra foram recentemente descritas 
no livro (WESTWICK; KEARNEY, 2003). 

Recentemente, o uso de modelos de Hammerstein Wiener tem atraído a 
atenção de vários pesquisadores (GREBLICKI, 1992, 1996; WIGREN, 1993; 
GREBICKLI; PAWLAK, 1994). Wigren (1993) desenvolveu um algoritmo 
para a estimação recursiva de modelos de Wiener, sendo que para isso a 
não-linearidade estática foi aproximada por uma função linear por partes, 
ao passo que Grebickli e Pawlak estimam a função estática de forma não- 
paramétrica. 

A identificação de modelos Hammertein e de Wiener, assumindo-se 
a característica estática conhecida a priori, foi abordada por Pearson e 
Pottmann (2000). Foi recentemente mostrado que um modelo NARX tem 
uma característica estática não-linear que se aproxima da característica 
estática do sistema real e que, se sua estrutura for adequada, é possível 
obter uma relação paramétrica que serve de aproximação dessa caracte- 
rística (JÁCOME, 1996; AGUIRRE; JÁCOME, 1998; AGUIRRE et al., 1998; 
CASSINI, 1999; AGUIRRE et al., 2002). Essa observação motivou o estudo 
da identificação caixa preta desses modelos (COELHO, 2002). 

Até o momento, parece não haver uma comparação crítica abrangen- 
te sobre diversas representações matemáticas para sistemas não-lineares. 
No contexto de séries temporais multivariáveis, diversas representações — 
inclusive modelos NARMA e redes neurais artificiais — foram comparadas 
por Çinar (1995), sendo que Bagarinao e Sato (2002) comparam alguns 
aspectos dos modelos V(N)JAR aos dos respectivos modelos MIMO. Tsoi 
(1998) compara uma série de representações matemáticas incluindo mode- 
Jos NARMAX e redes neurais artificiais do ponto de vista de equivalência 
matemática. Diversas representações matemáticas para descrever sistemas 
não-lineares foram abordadas em (CAMPELLO; OLIVEIRA, 2007). 

Uma vez que os modelos NARMAX são generalizações dos modelos 
lineares ARMAX, não é fácil identificar na literatura especializada a origem 
de tal representação. No contexto de identificação de sistemas não-lineares, 
duas das primeiras referências, nas quais modelos NARMAX começaram a 
ser investigados, são (BILLINGS; LEONTARITIS, 1981) e (PARKER; PERRY, 
1981). Nessas referências, como era de se imaginar, o foco recafa sobre 
questões pertinentes à representação matemática em si e suas relações com 
modelos de blocos interconectados do tipo Hammerstein e Wiener, 

Um dos primeiros artigos, em que a estimação de parâmetros para mo- 
delos NARMAX polinomiais foi investigada, parece ter sido (BILLINGS; 
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Voon, 1984). Finalmente, em 1985 as propriedades matemáticas da repre- 
sentação NARMAX foram discutidas em detalhe em (LEONTARITIS; BIL- 
LINGS, 1985a,b), mas sem qualquer preocupação com questões práticas tais 
como a escolha de estrutura e a estimação de parâmetros. 


O modelo racional parece ter sido originalmente proposto em (BILLINGS; 
CHEN, 1989b). Algoritmos específicos para estimação de parâmetros de 
modelos racionais podem ser encontrados em (ZHU; BILLINGS, 1991). Apa- 
rentemente, alguns dos poucos exemplos de modelos racionais NARMAX 
obtidos a partir de dados reais podem ser encontrados em (CORRÊA, 1997; 
CorréA et al., 2000; CORRÊA, 2001). 


No contexto de modelos NARMAX polinomiais, o conceito de agrupa- 
mento de termos e seus coeficientes merece destaque. Tais conceitos fo- 
ram originalmente propostos para modelos lineares em (AGUIRRE, 1994d), 
estendido para modelos não-lincares em (AGUIRRE; BILLINGS, 1995) e re- 
lacionados com os pontos fixos do modelo em (AGUIRRE; MENDES, 1996), 
O uso desses agrupamentos na seleção de estrutura será comentado no Ca- 
pítulo 12, veja também a seção de Leitura Recomendada desse capítulo. O 
conceito de agrupamentos-d, ver Seção 10.5, foi definido em (CORRÊA, 2001) 
e permite relacionar tais agrupamentos a aspectos dinâmicos dos modelos e 
não apenas a suas propriedades em estado estacionário. 


O uso de modelos polinomiais contínuos não-lineares foi investigado 
em (GOVESBET, 1991) e detalhados em trabalhos posteriores (GOVESBET; 
MAQuET, 1992; GOUESBET; LETELLIER, 1994). Vale a pena mencionar 
que nesses trabalhos os modelos contínuos são autônomos e foram obtidos 
sem esquemas de detecção de estrutura. Isso, como será visto no próxi- 
mo capítulo, traz consigo diversos problemas dinâmicos. O procedimento 
de estimação de derivadas apresentado no Complemento 10.2 é o mesmo 
proposto nas referências mencionadas acima. 


A literatura é muito farta em trabalhos sobre modelos que usam funções 
radiais de base (RBF do inglês radial basis functions) e redes neurais artifi- 
ciais. Uma introdução geral ao assunto de redes neurais artificiais e funções 
radiais de base pode ser encontrada em (HAYKIN, 1994) e, em português, 
em (BRAGA et al., 2000). Por outro lado, trabalhos que descrevem o uso 
de tais representações no contexto de identificação de sistemas dinâmicos 
são menos numerosos (CHEN et al., 1990; NARENDRA; PARTHASARATHY, 
1990) e, aparentemente, são raros os trabalhos sobre modelagem de siste- 
mas dinâmicos não-lineares que usam redes neurais artificiais (HENRIQUE 
et al. 1998). Algumas das características de redes RBF no contexto de 
identificação de sistemas dinâmicos não-lineares foi recentemente investiga- | 
do em (ALVES, 2004). As funções radiais de base parecem ter tido uma 
melhor aceitação na comunidade de sistemas dinâmicos não-lineares, sendo 
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que alguns trabalhos pioneiros nessa área são (BROOMHEAD; LOWE, 1988; 
CaspagLi, 1989; MEES, 1993). 

Uma vez que as redes neurais artificiais são representações matemáticas 
de caráter geral, elas podem ser utilizadas de diversas formas e não unica- 
mente na aproximação de funções dinâmicas; tem-se como exemplo disso 
Enrique Lima e colegas, os quais têm usado redes neurais artificiais em pro- 
blemas de identificação caixa cinza. Para um dado processo, as equações 
dinâmicas são escritas baseadas na física do processo (como no exemplo da 
Seção 1.4), sendo que redes neurais artificiais são treinadas para fornecer 
alguns dos parâmetros (nesse caso as redes neurais artificiais são mapas 
estáticos) de tais equações a partir de medições (CUBILLOS et al., 1996; 
CUBILLOS; LIMA, 1997). 

Um dos trabalhos pioneiros em identificação de sistemas utilizando uma 
representação fuzzy foi publicado em meados da década de oitenta (TAKAGI; 
SuGENO, 1985). Desde então diversas variantes foram propostas (TEIXEIRA 
et al. 2002). Campello e Amaral (1999, 2001) têm investigado o uso de 
lógica nebulosa (fuzzy) tanto na identificação de sistemas como na extração 
de regras usando modelos relacionais. Proposto por Yamakawa e colegas 
em 1992, o NFN é uma representação matemática não-linear, e representa 
um sistema nebuloso de inferência. O NFN tem sido usado com sucesso em 
problemas relacionados a monitoramento de sistemas dinâmicos e detecção 
de falhas baseados em estimação on-line de pesos (CAMINHAS et al., 2001), 
bem como em modelagem de sinais biomédicos (SOUZA et al., 2003). 

A aplicação de redes neurais e lógica nebulosa em problemas de controle 
foram recentemente abordados por Nascimento Jr. e Yoneyama (2000). O 
assunto de sistemas inteligentes em seus aspectos mais gerais de representa- 
ção, identificação e controle podem ser encontrados em (ALVES DA SILVA, 
2007). Sendo que uma visão comparativa de técnicas pode ser encontrada 
em (YONEYAMA, 2007); técnicas bio-inspiradas foram descritas e ilustradas 
em (VON ZUBEN; CAZANGI, 2007); modelos baseados em lógica nebulo- 
sa foram detalhadamente descritos em (TANSCHEIT et al., 2007); e redes 
neurais foram consideradas em (CALÔBA, 2007). 

Finalmente, a representação wavelet foi usada na identificação de sis- 
temas não-lineares (CAO et al., 1995; ROQUEIRO; LIMA, 1997; BILLINGS; 
Coca, 1999). 


Exercícios 


10.1. Monte as primeiras cinco linhas da matriz de regressores a ser utili- 
zada na estimação dos parâmetros [a b c] do seguinte modelo: 


v(k) = atan(y(k — 1)) + bexp(y(k — 2)) +c cos(wt + u(k — 1)). 
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Que dificuldades haveria em estimar o parâmetro w? 


10.2. Considere o modelo (ver Eq 10.8) 


2 
ulk) = wo + D5 vs dl(y — ci)” (ya — co] + usy(k — 1) + way(k — 2), 
i=l 


(10.94) 


em que y; = [u(k — 1) u(k — 2) u(k — 3)]" e e; € IRÊ são vetores de 
parâmetros chamados de centros. Considere a função radial q[:) : IR* 
R conhecida. Sob que considerações pode-se usar o estimador MQ para 
estimar os parâmetros w; desse modelo? Monte as primeiras linhas dos 
vetores e da matriz de regressores necessários à solução por MQ. Comente 
sobre o uso de funções radiais de base e termos auto-regressivos lineares em 
um único modelo. 


10.3. Considere uma rede neural do tipo (10.14) com três entradas e dois 
nodos na camada oculta (m = 3, n = 2). Tente representar a saída na forma 
y(k) = 70, sendo que o vetor O inclui todos os pesos a serem estimados. 
Que conclusão pode ser tirada deste resultado? 


10.4. Determine os pontos fixos de y(k)=Ay(k—-1)-Ay(k—1)2, chamada 
equação logística, e de y(k) = Ay(k-1)-Ay(k-1)?, chamada equação logística 
ímpar. Verifique a veracidade da segunda e terceira linhas da Tabela 10.1. 


10.5. Gere um sinal senoidal y(t) = sen(t). Adicione ruído branco de forma 
a resultar numa relação sinal /ruído da ordem de 50 dB. Utilize as aproxima- 
ções (1.39) e (1,40) e o procedimento descrito no Complemento 10.2 para 
estimar as derivadas (k) e jj(k). Compare o desempenho desses procedi- 
mentos com os valores teóricos de 1)(k) e ij(k). Discuta como o intervalo de 
amostragem influi no desempenho dos estimadores, 


10.6, Tente provar que os pontos fixos estimados, conforme descrito no 
Complemento 10,3, são mais robustos à polarização induzida por ruído do 
que os parâmetros propriamente ditos, 


10.7. Determine, utilizando o conceito de agrupamento de termos, as condi- 
ções para que a matriz (10,51) seja única. Determine, utilizando o conceito 
de agrupamento de termos, as condições para que a matriz (10.51) seja igual 
à matriz jacobiana do sistema, 
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TOS, Demonstre que, para um modelo NARX polinomial, a definição de 
“matriz jacobiana na Eq, 9,39 coincide com aquela mostrada na Eq. 10,52. 


20,9, À matriz em (10.59) € única? Qual é a matriz jacobiana do modelo 
10.32)? Represente o modelo (10.32) completo, ou seja, sem desprezar a 
entrada, em espaço de estados. 


20.10, Discuta quais os agrupamentos de termos não podem estar presentes 
em um modelo polinomial NARX a fim de poder expressar a característica 
estática do modelo da seguinte maneira j = f(ã). 


10.11, Obtenha expressões para os ganhos dos modelos (10.74) e (10.75). 
Procure reproduzir as respectivas características estáticas desses modelos, 
mostradas na Figura 10.8. 


10.12. Considere modelos do tipo Hammerstein e de Wiener para os quais 
a não-linearidade estática seja f(z) = 2º, Tome o bloco dinâmico linear 
desses modelos como sendo 


v(k) = axy(k — 1) + azu(k — 2) + bru(k — 1) + bou(k — 2). 
Desenvolva analiticamente a equação dos modelos de Hammerstein e de 
Wiener e mostre que tipo de regressores aparecem nos modelos finais. 


10.13. Discuta e mostre por que os estimadores apresentados nos Capí- 
tulos 5 e 7 resultam em polarização ao estimar os parâmetros de modelos 
racionais ainda que o erro na equação de regressão seja branco. 


10.14. Verifique a validade das Eqs. 10.76-10.78, aplicando-as aos mode- 
tos (10.74) e (10.75). 


10.15. Mostre que as Eqs. 10,76-10,78 podem ser reescritas em forma ma- 
tricial como (10.79) e (10.80). 
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Identificação de Sistemas 
Não-Lineares: Algoritmos 


11.1 Introdução 


No Capítulo 10 foram apresentadas diversas representações usadas para mo- 
delar sistemas dinâmicos não-lincares. Apesar de não apresentar detalhes, 
o capítulo anterior mostrou algumas semelhanças e principais diferenças no 
uso de cada uma das representações, Um problema comum a todas elas é a 
necessidade de cuidadosamente determinar a estrutura, ou seja, a topologia 
de cada modelo, Sabe-se que modelos matemáticos que sejam um pouco 
mais complexos do que o necessário podem resultar em inúmeros efeitos 
dinâmicos espúrios. Esse assunto, bem como a descrição de algumas técni- 
cas úteis para a determinação da estrutura de modelos serão discutidos no 
Capítulo 12. 

Tendo definido qual será a estrutura de um modelo, o passo seguinte 
normalmente é o de determinação de parâmetros. Na realidade, essas 
duas etapas são freqiientemente executadas simultamente. Há diversos 
algoritmos para a estimação de parâmetros de modelos matemáticos. Vários 
deles podem ser agrupados na família de estimadores derivados a partir 
do estimador MQ. Tuis algoritmos são robustos e, normalmente, fáceis de 
implementar. Entretanto, só podem ser aplicados a modelos lineares nos 
parâmetros a serem determinados. Para modelos não-lineares nos parâme- 
tros, como, por exemplo, as redes neurais perceptron multicamadas, algo- 
ritmos mais específicos precisam ser usados. 

No presente capítulo serão apresentados algoritmos para estimação de 
parâmetros de representações que são lineares em tais parâmetros. Será 
suposto que os modelos são não-lineares, o que necessariamente implicará 
o problema de ter que escolher a sua estrutura dentre uma ampla gama de 
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possibilidades. Portanto, os algoritmos a serem descritos nas Seções 11.2 
a 11.4 terão o objetivo de resolver o problema da escolha de estrutura e 
o da estimação de parâmetros. Para facilitar a discussão, tais algoritmos 
serão apresentados no contexto de modelos NARMAX polinomiais, mas 
sua aplicabilidade não se restringe a esse tipo de modelos, sendo que na 
Seção 11.4 será abordada a aplicação de tais algoritmos na identificação de 
modelos racionais. 

Os algoritmos apresentados nas Seções 11.2 a 11.5 exigem linearidade 
nos parâmetros. Como modelos racionais não são lineares nos parâmetros, 
é necessário tanto reescrever tais modelos de forma conveniente bem como 
adaptar os algoritmos. Isso será discutido na Seção 11.4. Com isso, tais 
algoritmos podem ser também aplicados a modelos lineares, ainda que isso 
não seja normalmente necessário. Na Seção 11.5, serão descritos estimadores 
com restrições e que minimizam uma função custo que pode ser interpretada 
como a combinação ponderada de objetivos distintos. Tais estimadores 
podem ser usados tanto para estimar os parâmetros de modelos lineares 
como os de modelos não-lineares. O uso de tais algoritmos na identificação 
caixa cinza será apresentado no Capítulo 15. 


11.2 Algoritmos MQ Ortogonais 


A fim de apresentar alguns algoritmos baseados em mínimos quadrados 
para a estimação dos parâmetros de modelos polinomiais NARMAX, será 
conveniente usar a representação (10.22). Aplicando-se (10.22) N vezes, em 
segiência ao Jongo dos dados, será obtida a seguinte equação matricial: 


y=VÔ+e, (11.1) 


sendo que as medições em 'Y para tempos negativos serão assumidas como 
sendo zero. Os vetores e a matriz na Eq. 11,1 são 


(1) Ô €(1) 
é gi PV =[b. ny]; Ô= q jê= o (11.2) 
vim) du EM) 
; (1) 
i= no vi=12,...n0 (11.3) 
vi(N) 
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Exemplo 11.2.1. Matriz de regressores de um modelo NARX 


A fim de ilustrar a nomenclatura acima definida, considere o modelo do 
Exemplo 10.3.2. As primeiras quatro linhas da matriz de regressores nesse 
caso são 


v(O) u(=1) u(o) ... u(Ou(0) u(-Iu(0) 
vm) (o) ul) o (Du) u(O)u(1) 
v=| 2) ul) u(2) ... ul2)u(2) u(i)u(2) 
v63) u2) ul) o u(Bu(3)  u(2)u(3) 


Além disso, tem-se 


v(o) v(-1) v(-Du(0) 
v(1) v(o) v(Ou(1) 
Y= : Cd He 2 ' = 
v(N-1) v(N=2) WN=2u(N=1) 
e assim sucessivamente. D 


Se a matriz de regressores Y não possuir muitas colunas e somente con- 
tiver valores conhecidos (tipicamente valores dependentes dos sinais y(k) 
e u(k)), é possível estimar o vetor de parâmetros pelo método clássico de 
mínimos quadrados, ou seja, conforme visto no Capítulo 5, bastaria calcular 


= [Uru yTy. (11.4) 


Entretanto, no caso de Y possuir muitas colunas, que é o caso típico 
na identificação de sistemas não-lineares, o uso da matriz pseudo-inversa 
em (11.4) não resultaria em boas estimativas. Existem alternativas nume- 
ricamente mais interessantes. Tais métodos são baseados em métodos de 
mínimos quadrados ortogonais (MQO) e exploram o fato de a matriz YTW 
ser simétrica por construção. No restante desta seção, serão descritos três 
algoritmos. Detalhes sobre a decomposição de matrizes podem ser encon- 
trados no Anexo B. 


11.2.1 O método clássico de Gram-Schmidt (CGS) 


O objetivo neste método é fatorar a matriz de regressores Y, que é de posto 
pleno, da seguinte forma Y = QA, sendo que 


Digitalizado com CamScanner 


422 11 IDENTIFICAÇÃO DE SISTEMAS NÃO-LINEARES: ALGORITMOS 


1 mp2 013 «Qing 
0 1 023... rn 
Ada Ce Ms ci : , (11.5) 
O O MI ênam 
0 0 0 0 1 


é uma matriz triangular superior de dimensão ng X ng, e Q é uma matriz de 
dimensão N x ny com colunas ortogonais tal que QTQ = D, sendo D uma 
matriz diagonal, definida positiva. 

O algoritmo clássico de Gram-Schmidt calcula 4, coluna por coluna, 
e ortogonaliza W da seguinte forma: na i-ésima iteração, determina-se a 
i-ésima coluna de forma a ser ortogonal às i — 1 colunas previamente cal- 
culadas. Tal procedimento é executado para i = 2,3,... ,n9, e pode ser 
representado como se segue: 


q=W 

o Basa 
f=1 

q = Wo) Qjuaj (11.6) 
j=1 


sendo que as duas últimas equações devem ser resolvidas para i = 2,... ng 
e (:,:) indica o produto interno. Portanto, a partir da equação normal, 
tem-se 


VTYÔ = WTy 
ATQTQNO = ATQ'y 
ATDAd = ATQ!y 
DAS = QTy 
4d = DIQTy, (11.7) 


sendo que (11.7) fornece os parâmetros & = Aô do modelo no espaço orto- 
gonal. Portanto, tais parâmetros podem ser determinados usando-se (11.7) 
ou 


CR PRE t=12,.0. sNg- (11.8) 


se | 
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Finalmente, os parâmetros do modelo original (representado no espaço 
de regressores não ortogonais) podem ser determinados como Ô = A-!g, 
Deve ser notado que como À é uma matriz triangular superior, ô pode ser 
determinado por substituições sucessivas. 


11.2.2 O método modificado de Gram-Schmidt (MGS) 


O método modificado de Gram-Schmidt objetiva resolver problemas de sen- 
sibilidade a malcondicionamento numérico observados no método clássico 
descrito na Seção 11,2.1, A fim de atingir esse alvo, o método MGS de- 
termina a matriz A uma linha por vez e ortogonaliza Y de tal forma que 
na i-tsima iteração as colunas à + 1,... ny são feitas ortogonais à i-ésima 
coluna. Essa operação é repetida para à = 1,2,...,ng — 1. Indicando entre 
parênteses a iteração, tem-se vi = Vpj =1,.usng e 


a = vt 
(t=1) 
[om a Ee 


vo = VD = aa j=i+1,... 0, 


sendo que essas três equações são resolvidas para à = 1,2,...,ng — 1, Fi- 
nalmente, na ny-ésima iteração tem-se qro = plno=1) - Os parâmetros do 
modelo ortogonalizado, É, são determinados fazendo-se y() = y e 


do 9) 


A (aqi) 
yO = y06D- gas (11.9) 
para i = 1,2,... ,n9. À determinação dos parâmetros correspondentes aos 


regressores do modelo pode ser efetuada como no método CGS, ou seja, 
calculado-se à = A-!g. 


11.2.3 O método de Golub-Householder (GH) 


Nesta seção será vista a aplicação do método Golub-Houscholder ao pro- 
blema de estimação por mínimos quadrados dos parâmetros do modelo 
y(k) = Tô + E(k). Para isso, opera-se sobre a equação de regressão de 
forma a alterar as matrizes e vetores, mas mantém-se o vetor 6 inalterado. 
Portanto, pré-multiplicando o modelo citado por uma matriz Q E IR"oXno, 
tem-se 
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Qu(k) = QuTô + QE(h) 
V(k) = p'TO + Eh). (11.10) 


A função custo de mínimos quadrados neste caso torna-se (compare com 
a Eq.5.13) 


N 
Jg =D él) = eme. (11.11) 


i=1 
Procedendo-se como no Capítulo 5 e lembrando-se de que o modelo 
(11.10) dá origem à equação matricial y* = W*+0 + €*, tem-se 
Jg = (= Wô(' - w'8) 
= yTytymwd Dry + O wmrô 
y"Q"Qy - y"Q"Quô - d"WrQ"Qy + B'vTQrquê 
= (y- VÔ QT — VÔ), (11.12) 


Para que Jyq = Juq = (y— vô)” (y — VÔ), necessariamente QTQ = I, 
que é a condição para que a matriz Q) seja ortonormal. Além disso, impõe-se 
que 

V 
V=QV= | 0 | (11.13) 
sendo que V é triangular superior e V € IR"ºX"9, Então, 
V 
Tt — T nT' 
vp = [VT07 0 | 
= VFV 
= W'Q"QU 
= Ty, (11.14) 


Reescrevendo Jyo, tem-se 
(]-Lo)o) (Bil-Lo 9) 
(br rom o) (il-[6]8) 


= yityt+yityi = O VTyy -yjrvÔ + 0 VTVô 


Jyuq 


H 


(y7- Vô) (yj — VÔ) + y3" yo. (11.15) 


d 
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Claramente, Jhq é minimizado quando yj = Vô, Nesse caso, tem- 
so que Oq = V-lyt e, consegilentemente, J4q = y3"y3. Como V é 
triangular superior, a estimativa 


dmg =Volyi (11.16) 


pode ser calculada com relativa facilidade. Na Seção B.3 é detalhado um 
algoritmo que pode ser usado para determinar a matriz Q. 

Como será detalhado na próxima seção, uma variante do método de 
Golub-Houscholder será de grande utilidade, não apenas para estimar os 
parâmetros do modelo, mas também para ajudar na escolha da estrutura 
do mesmo. 


11.3 A Taxa de Redução de Erro 


Uma observação importante com respeito aos algoritmos apresentados na 
seção anterior é que os métodos MQO (bem como todos os demais algorit- 
mos discutidos até este ponto) assumem que todas as variáveis independen- 
tes, ou seja, todos os regressores, foram previamente determinados. Nesta 
seção, será definido um critério, denominado taxa de redução de erro, que 
poderá ser usado na determinação dos regressores de um modelo. 

A fim de definir a taxa de redução de erro, será considerado o seguinte 
modelo NARMAX geral: 


ulk) = WT(k— 1)ô + E(k) 
= 35 ômulk=1)+6(k) 


i=l 


e o seguinte modelo auxiliar 


ulk) = DO du = 1) +6(8), (11.17) 


i=1 


sendo que os regressores em (11,17), w;, são ortogonais sobre os dados. 
Uma consegiiência direta dessa ortogonalidade é que a média temporal do 
produto w;(k)w;(k) ao longo dos registros dos dados é nula Vi f j, ou seja, 


1 N 
TD tslk)us(k) =0, 
k=1 
wi(kjw;(k) = 0, Vit 3, (11.18) 
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ou simplesmente (wi, w;) = O (ver Definições A.1.3 e A.1.4), sendo que 
wi = [wi(1)...w;(N)]”. O argumento k — 1 indica que os regressores são 
tomados até o instante k — 1. A soma dos valores quadráticos de y(k) é 
(y,y) ou yTy. Portanto, multiplicando-se (11.17) por ela mesma tem-se 


ví)? = (Ema +60) | Se plia 1)+E(k) |. (11.19) 


i=l j=1 


Tomando-se o valor médio ! de (11.19) sobre os dados (compare com a 
Eq.11.18), tem-se 


1 1 
po ue = (voy) 
k=1 


ng na 
(7) = Dmwmw)+ Do 2udylwawj)+ 
i=1 i=lj=1Nitj 
ng 
+25) du(wi, 6) + (6,6) 
i=l 
= 55 (ww) + (6,8). (11.20) 
i=1 


O último passo na Eq. 11.20 foi obtido observando-se que, por construção, 
os regressores w; são ortogonais entre si e que tais regressores não estão 
correlacionados com os resíduos. 

A interpretação da Eq. 11,20 é a de que a soma dos valores quadráticos 
de y(k) pode ser explicada, usando uma base ortogonal, como o somatório 
dos valores quadráticos de cada regressor ortogonal respectivamente multi- 
plicados pelos seus parâmetros. À parcela não explicada pelos regressores é 
igual à soma dos valores quadráticos do vetor de resíduos, E(k). 

Portanto, a Eq. 11,20 permite quantificar a importância de cada regres- 
sor individualmente, Para ver isso, considere o caso em que não há nenhum 
regressor, ng = 0, Obviamente, o erro cometido é o próprio sinal observado, 
uma vez que tal “modelo” não explica nada das observações. Se o i-ésimo 
regressor for acrescentado ao modelo, a parcela de (y,y) que passa a expli- 
car é 92(wi, wi). Portanto, a taza de redução de erro devido à inclusão do 
i-ésimo regressor expressa como uma fração da soma dos valores quadráticos 
dos dados é 

!A menos de uma constante, o valor médio de z(k)? coincide com o produto interno 


de z(k), tomando-se k = 1,...,N. Daquiem diante, será mais prático fazer os 
desenvolvimentos em termos do produto interno. 
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— Mwi wi) 


(ERR); = ne (11.21) 


sendo que a sigla ERR vem do inglês error reduction ratio. Um critério 
que pode ser usado para ajudar a escolher os regressores de um modelo é 
incluir os regressores com maior ERR dentre um conjunto de regressores 
candidatos normalmente grande. 

O uso da Eq. 11.21 para determinar o ERR é limitado pelo fato de 
que tal equação necessita das estimativas dos parâmetros q;, sendo que se 
deseja poder escolher os regressores antes de estimar os parâmetros. Para 
o modelo (11.17), representado em base ortogonal, os parâmetros podem 
ser calculados da seguinte forma (comparar com (5.45) e também com o 
Exercício 5.10): 


2 (wi) 
Gi= (wriswi) 


ji= Lo. (11.22) 


Sendo assim, o uso de (11.21) e de (11.22) é viável desde que se tenha o mo- 
delo representado numa base ortogonal. O restante desta seção é dedicado 
a descrever alguns algoritmos capazes de determinar uma base ortogonal 
adequada, bem como estimar os respectivos parâmetros. Em outras pa- 
lavras, as Seções 11.3.1, 11.32 e 11.3.3 descrevem algoritmos capazes de, 
simultaneamente, resolver o problema de determinação de estrutura e o de 
estimação de parâmetros. 

Os algoritmos descritos a seguir consideram uma matriz de regressores 
candidatos Y. Não é especificado se tal matriz é estendida (como requeri- 
do na identificação de modelos (NJARMAX) ou não. Se o modelo for do 
tipo (NJARMAX, o estimador usado será EMQ e, nesse caso, a matriz Y 
contém regressores de ruído que precisam ser atualizados iterativamente. 
Assim sendo, deve-se perceber que os algoritmos detalhados a seguir serão 
executados uma única vez, no caso de identificação de modelos (NJARX, e 
iterativamente, no caso de modelos (N)JARMAX. 


11,3.1 O algoritmo CGS 


O alvo do presente algoritmo será o de escolher um subconjunto dentre 
os possíveis regressores (chamados regressores candidatos) para compor o 
modelo, Assim, dado um conjunto original de candidatos que pode ser 
representado pela matriz de regressores 'Y, deseja-se obter uma submatriz 
Y, tal que dim[Ys) < dim[Y]. Os regressores correspondentes às colunas de 
'Y, serão usados para compor o modelo final. 
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À semelhança da Seção 11.2.1, procura-se a fatoração Vs = As, sendo 
que As é uma matriz triangular superior como mostrado em (11.5), mas de 
dimensão menor. Qs é uma matriz ortogonal. Os resíduos do submodelo 
são dados por 


é& = y- Vô, 
= y= VsAÇI Ads 
= y-Quês (11.23) 


sendo que &s = AsÔs. Portanto, o vetor de observações da variável de saída 
pode ser expresso em termos do submodelo da seguinte forma: 


y = Quês — E (11.24) 


Tomando-se o produto interno de (11.24), como feito anteriormente em 
(11.20), tem-se 


ng 
(7) = Do Gêvei Wai) + (Es, 65), (11.25) 
tm=l 


sendo que agora ng = dim[ô5] < dim(Ô] e às; são os parâmetros do submo- 
delo. Em geral os regressores do submodelo serão diferentes das primeiras 
ny colunas de Y, conseqiientemente, a mesma observação é válida para os 
respectivos parâmetros. Sendo assim, a definição da taxa de redução de 
erro (11.21) é usada para determinar a contribuição de cada regressor no 
valor quadrático médio do sinal observado y(k). 

O objetivo torna-se, portanto, escolher os regressores mais significativos 
de acordo com o critério (11.21) durante o procedimento de ortogonalização. 
Uma forma de se fazer isso é detalhada a seguir. 

O procedimento começa na primeira iteração fazendo-se qu =); para 
i=1,... /dim[Y] e calculando-se (ver Egs. 11.8 e 11.21) 


AD ECNEIR 
nm = (a a) a) 
talo 

(ERR? (latest, (11.26) 


Portanto, nesse ponto, tem-se um conjunto de dim['Y] parâmetros, 98 , 
e um outro conjunto de mesma dimensão, (ERR, de valores da taxa de 
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redução de erro (ERR) de cada um dos regressores candidatos. O próximo 
passo consiste em tomar o regressor que tenha o maior ERR e formar a 
partir dele a primeira coluna da matriz Qs. Portanto, supondo-se que 
[ERR = max((ERRIP, 1<j< dim[Y) então q; = a! ) será escolhida 
a primeira coluna da matriz Qs, com os respectivos parâmetros e valores de 
ERR, ou seja, ós(1) = 917 e [ERR] = max(BRRJO, 1 < j < dim[v)) 
Supondo-se que a dintaia coluna de Y tivesse o maior ERR, então tem-se 
[ERR = max(ERRIS) , 

Na segunda iteração, parai =1,... ,dim[W] menos para i = j,, procede- 
se da mesma maneira. Ou seja, percorrem-se todas as colunas de Y, à 
exceção da coluna que corresponde ao regressor que já foi escolhido para 
compor o modelo. Portanto, calcula-se (ver Eq. 11.6): 


0) — Gibi) 
to (ana) 


' (98) (a! (1) qt) 
(ERR? = DT ; (11.27) 


e a escolha do novo regressor é feita de maneira a satisfazer o seguinte: 
[ERR] = max[[ERRJP, 1<j<dim[Y)ejji. Supondo-se que o 
índice a coluna de Y que satisfaz a condição acima seja j, então tem-se 
q = q? A sendo que ab =; — 01,2051- A última igualdade indica que 
a segunda coluna da mabiik ortogonal (Qs é composta ortogonalizando-se a 
j2-ésima coluna de Y (escolhida por corresponder ao segundo regressor em 
importância em termos de ERR). Como anteriormente, não apenas uma 
coluna de Y é selecionada, mas também são escolhidos os correspondentes 
valores do respectivo parâmetro, taxa de redução de erro e coluna da matriz 
A. Ou seja, 12 = al,29, às3 = = e [ERR] = [ERRJ9. ) Finalmente, o 
vetor de pRERREDA na representação original pode ser determinado como 
sendo Ô, = Az!ês. 

O procedimento acima pode ser continuado até que o modelo seja con- 
siderado adequado. Nem sempre é fácil determinar o momento de parada. 
Um critério simples é continuar acrescentando regressores ao submodelo 
até que a parcela não explicada pelo modelo do valor quadrático médio do 


sinal observado seja menor do que uma determinada tolerância, p, ou seja, 
aumenta-se ny até que 
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no 
1-5) [ERR Sp, (11.28) 

i=1 
sendo que O < p < 1. Esse critério de parada pode parecer bom, mas 
na maioria dos casos resulta em modelos com dinâmica inadequada. Um 
procedimento mais eficaz, porém mais caro computacionalmente, é, para 
cada modelo (cada valor de ng), testar alguma característica de interesse do 
modelo. Esse procedimento está intimamente relacionado com a validação 
do modelo e com detalhes que serão deixados para o Capítulo 13. 


11.3.2 O algoritmo MGS 


O algoritmo clássico de Gram-Schmidt pode, às vezes, resultar em malcon- 
dicionamento numério se a matriz Qs ainda for de dimensão elevada. Con- 
forme observado na Seção 11.2.2, o algoritmo modificado de Gram-Schmidt 
(MGS) foi elaborado a fim de contornar dificuldades de condicionamento 
numérico observadas em alguns casos no algoritmo clássico. 

No algoritmo MGS, as colunas de k + 1 a dim[W] são feitas ortogonais 
à k-ésima coluna, na k-ésima iteração, ou seja, 


VO-D = fas... eps VD. li] (11.29) 


Na k-ésima iteração calcula-se, para i = k,... ,dim(W), 


a = O Le) 
RR a) 
(5 (2 (uptt = 1) apto e) 


(k) 
do o) 


(11.30) 


Supondo-se que [ERR = max((ERRJP, k < j < dim[YW]] seja verdadeiro 
para j = jk. Assim, a jp-ésima coluna de W(k-1) será intercambiada com 
a k-ésima coluna. As linhas de 1 a k-— 1 da jp-ésima coluna de A são 
intercambiadas com a k-ésima coluna. Os parâmetros e os vetores yº são 
atualizados de acordo com (11.9). 


11.3.3 O algoritmo GH 


O ponto de partida é montar a seguinte matriz estendida antes da primeira 
iteração (ver Seção B.3): 


50 = po y]= (40...) y/0), (11.31) 
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A matriz V; € IR*Xk é a submatriz de V € IR"9X"9 obtida eliminando-se 


as linhas e colunas de k + 1 a ng. A matriz V, por sua vez, foi definida em 
(11,13). 


Após k — 1 transformações de Householder, H(D.., H (&-1), terem sido 
aplicadas à matriz W(0), tem-se 


ú Ve 
A USD RD ye |, (39) 
0 


sendo O uma matriz (N — k+1) x (k-1). Um modelo que contenha os 
primeiros k — 1 parâmetros e respectivos regressores terá a seguinte soma 
dos resíduos ao quadrado (ver Eq. 11.15): 


N 
JD = So (ot (11.33) 


i=k 


- Quando a k-tsima transformação, H (8), é aplicada a Wl=D, obtém-se 
V(k) e, se o novo regressor for adicionado ao modelo, então a soma dos 
resíduos ao quadrado (11,33) € reduzida a 


Da] A Ho aa) - (ut 
DACUR 


O alvo torna-se escolher dentre as colunas 4, à pt aquela para 
2 
a qual (ut) é máximo. Em outras palavras, na k-ésima iteração deseja-se 


escolher o k-êsimo regressor que, quando incluído no modelo, resultará na 
maior diminuição da soma dos quadrados dos resíduos. Para isso, calculam- 
se as seguintes grandezas: 


N 
- 2 
a =3> (080) js kn (11,34) 
i=k 
k A k 
0 =55 UG DUO, j =... me, (11.35) 
i=k 


lembrando que ud é o (ij)-ésimo elemento da matriz W(k-1), 
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O benefício de se introduzir o j-ésimo regressor no modelo pode ser 
2 
quantificado usando-se a taxa de redução de erro do regressor, ? (1º) Mlyy) 


(ver Eq. 11.21), ou em termos de af e 08 ; 


(9,7) 


(912 ql) () 
8) DS sa (8 ) Ú 
E) Vo)” Om EuLg) 
a; Yo) a(yy) 


PO) RO) (+) 

, 9 ) O; ; “ay 

[ERR é. (as ) E (un) É 
2 


Finalmente, o procedimento de determinação de estrutura na k-ésima 
iteração consiste em calcular [ERRJÉ para todos os regressores candidatos 
que ainda não tenham sido incluídos no modelo, ou seja, j = k,...;no. 
Chamando jm O índice para o qual o máximo ocorre, basta permutar as 
colunas k-ésima e jm-ésima de W(k-1) e, então, efetuar a k-ésima transfor- 
mação de Householder. 

Os três algoritmos descritos nesta seção baseiam-se nos mesmos concei- 
tos. O que os distingue é basicamente a forma com que a decomposição 
ortogonal é feita. Na prática, isso resultará em desempenhos diferentes do 
ponto de vista numérico e computacional. Do ponto de vista da modelagem 
propriamente dita, não há razões para se crer que um algoritmo seja sis- 
tematicamente superior aos demais. Além disso, é comum tais algoritmos 
escolherem alguns regressores espúrios, ou seja, regressores que realmente 
não são necessários para compor o modelo. Será importante, então, apren- 
der a detectar quais regressores, num determinado modelo, são espúrios. 
Esse assunto será deixado para o capítulo seguinte. Por agora, serão apre- 
sentados três exemplos para ilustrar algumas das características básicas do 
procedimento de identificação de modelos não-lineares usando métodos orto- 
gonais para o problema conjunto de determinação da estrutura e estimação 
de parâmetros, 


Exemplo 11,3.1. Identificação da equação logística 


O presente exemplo considerará poucos (oito) valores gerados usando-se 
a equação logística y(k) = 3,9y(k — 1) — 3,9y(k — 1)2. Inicializando-se tal 
equação com valores entre O e 1, obtém-se uma seqiiência de números que 
é caótica, 
2É importante notar que o j-ésimo regressor (j =k) será incluído no modelo na 
k-ésima iteração, após a plicação de k — 1 transformações de Householder (notar que 
(ERRJ depende de af e Du que, por sua vez, são calculados depois da (k— 1)-ésima 
transformação de Householder, conforme pode ser visto em (11.34) e (11,35)). 
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A fim de obter um modelo a partir dos dados, geram-se todos os posst- 
veis regressores candidatos até segunda ordem com grau de não-linearidade 
até dois, ou seja, para ny = 2e (= 2 em (10.18) (ver Exercício 11,4). Se 
todos os regressores possíveis (para ny = 2 € (= 2) forem incluídos, pro- 
vavelmente haveria problemas de malcondicionamento numérico, a despeito 
da complexidade dos dados. 

Usando-se o algoritmo GH (exlog O), chega-se à seguinte matriz (ver 
Eq. 1113): 


-2,8284 —1,2701 —1,7023 —1,2874 —1,7113 —0,9264 
09446 08170 —0,4957 —=0,2807 0,401 

. -0,1641 0,4364 0,3867 —0,0263 
ps -0,7097 -0,6961 —0,3622 
—0,0383 

—0,1232 


Pivotando-se a matriz de regressores originais, de acordo com o proce- 
dimento descrito na Seção 11.3.3, chega-se aos primeiros quatro regressores 
(em ordem decrescente de importância, segundo o critério ERR): constan- 
te, y(k— 1)2, y(k — 1) e y(k — 2)2, com as respectivas taxas de redução de 
erro: 0,8302; 0,0524; 0,1175 e 6,74x 1072 x 0, Esses valores sugerem que 
apenas Os primeiros três regressores devem ser considerados. Estimando- 
se os parâmetros dos três primeiros regressores, obtêm-se, respectivamente: 
-1,15 x 10714, -3,9 e 3,9, sem problemas de condicionamento numérico. 
Claramente, o regressor constante (com parâmetro —1,15 x 10-14) é espúrio 
e pode ser omitido do modelo. Portanto, retendo-se apenas os regressores 
y(k — 1)2 e y(k — 1) e reestimando-se os parâmetros, chega-se exatamente 
ao modelo que gerou os dados, 

O presente exemplo mostra que, às vezes, regressores espúrios são esco- 
lhidos pelo critério ERR e que é conveniente desenvolver formas de descobrir 
quais regressores podem ser eliminados numa segunda etapa. No caso da 
logística, que é um modelo polinomial auto-regressivo, não houve maiores 
problemas e o regressor espúrio teve seu coeficiente estimado como sendo 
praticamente zero. Em muitos casos, como o ilustrado no próximo exemplo, 
isso não será tão evidente, [a] 


Exemplo 11,3,2, Escolha de agrupamento de termos para oscilador eletrônico 
Os dados utilizados neste exemplo foram coletados de um oscilador ele- 


trônico não-linear (devci O), que será descrito em mais detalhe na Se- 
ção 16.2. 
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O ponto de partida é gerar um conjunto de termos candidatos. No 
presente exemplo, foram tomados o termo constante e as combinações até 
terceiro grau dos monômios y(k — 1) e y(k — 2), ou seja, foi considerado 
ny=2e!=3 em (10.19); ao todo são dez regressores. Em segundo lugar, 
utilizou-se o algoritmo descrito na Seção 11.3.3 para ordenar os regressores 
por importância, de acordo com a taxa de redução de erro. O resultado 
está mostrado na Tabela 11.1 


TABELA 11.1: Regressores, parâmetros e ERR 


Ordenação em ordem decrescente de importância (ERR) dos dez regressores can- 
didatos, para dados medidos de um oscilador eletrônico. 


Regressor 0; ERR 
y(k=1) 2,0318 9,8444 x 105! 
y(k — 2) —9,6099 x 107! 1,3762 x 102 
y(k — 1)2y(k — 2) 6,5580 9,6521 x 1074 
ylk= 1) 2,5508 x 10-2 1,3457 x 1075 
ulk= 1) -2,5916 1,8259 x 10-8 
u(k — Dy(k — 2)? —5,6382 4,8803 x 1075 
ulk — 2) 1,5341 2,3595 x 1078 
y(k — 2)2 3,3658 x 1072 2,9550 x 10-8 
y(k-—1)y(k—2) —6,4813 x 102 1,1252 x 10-7 
constante —1,6458 x 10"! 1,4065 x 10-8 


O resultado acima revela algumas coisas interessantes. Em primeiro 
lugar, os termos quadráticos e o constante são os últimos na lista e seus 
coeficientes estimados estão entre os menores. À exceção parece ser o termo 
y(k — 1)? que aparece em quarto lugar na lista de prioridades do algoritmo. 
Vale a pena observar que, apesar de y(k — 1)? aparecer em quarto lugar, o 
parâmetro estimados é pequeno, bem como o coeficiente do agrupamento 
Mp que é Lj = —5,6471 x 10-3, Isso sugere um possível cancelamento, 
o que, normalmente, pode ser entendido como evidência de que 2,2 é um 
agrupamento espúrio, O Capítulo 12 discutirá com mais detalhes o uso 
dos conceitos de agrupamento de termos e coeficientes de agrupamentos na 
determinação da estrutura de modelos. 

Uma última observação é que os termos y(k — 1)3 e y(k — 2)? têm taxas 
de redução de erro menores do que a dos termos que os sucedem. Esse 
é um problema essencialmente numérico, não muito raro, e quase sempre 
ocorre com valores de taxas de redução de erro várias ordens de grandeza 
menores do que a maior taxa de redução de erro de algum regressor no 
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modelo. Este problema, mais uma vez, evidencia que é desejável desenvolver 
procedimentos auxiliares pelos quais determinados termos, ou agrupamento 
de termos, podem ser incluídos ou retirados dos modelos. [a] 


Exemplo 11.3.3. Identificação de modelo com termo exponencial 


Deve ficar claro que os algoritmos descritos na Seção 11.2 e na presente 
não se limitam a modelos cujos regressores sejam monômios ou multinômios 
do tipo y(k=i)/u(k=m)", im = 1,2,... ejn =0,1,... O presente exemplo 
ilustra essa afirmativa. Para isso, foram gerados dados usando-se o seguinte 
modelo com termo exponencial: 


Wlk) = 04y(k— 1) +0,5y(k — 2) + u(k — 1) 
0,3 y(k — 1)exp[-u(k — 2?) + e(k), (11,87) 


sendo que u(k) e e(k) foram escolhidos como variáveis aleatórias indepen- 
dentes, com distribuição gaussiana, média zero e variâncias o2 =09€e 
02 = 0,0025, respectivamente. Modelos com termos exponenciais são muito 
comuns em diversas áreas do conhecimento. Foram tomados 490 valores, 
gerados pelo modelo (11.37), e um conjunto de 21 regressores candidatos 
(extended 0). Além de todos os multinômios de grau e ordem dois, ou seja, 
t=2eny = ny = 2, foram gerados regressores exponenciais da forma 
vlk = jJexpl=2(k — 1)? com i.j = 1,2 e 2(k) = u(k) y(h). 

O uso do algoritmo descrito na Seção 11.3.3 resultou na escolha dos 
regressores u(k — 1), y(k — 2), y(k — 1) e y(k — 1)exp[=u(k — 2)2) com os 
seguintes parâmetros, respectivamente: 1,0022; 0,5016; 0,3978 e -0,2928. A 
taxa de redução de erro desses regressores é: 0,54778; 0,37039; 7,1152x 1072 
e 9,1295 x 1073, as quais, somadas, resultam em 0,99845, ou seja, esses 
quatro regressores explicam mais de 99,8% do valor médio quadrático do 
sinal de saída y(k). 

Apesar de funcionar bastante bem, o procedimento recém-descrito assume 
que o grupo de termos candidatos inclui todos os tipos de regressores ne- 
cessários para explicar os dados em questão. Um problema muito mais 
complicado, e que está sem solução definitiva na literatura especializada, 
é inferir o tipo de termos que são necessários para representar um certo 
conjunto de dados. Esse problema corresponde a “gerar” os regressores cer- 
tos olhando apenas para os dados, em vez de escolher os regressores mais 
adequados dentre um conjunto de candidatos previamente definido. [a] 
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11.4 Algoritmos para Modelos Racionais 


Esta seção descreve um algoritmo que pode ser utilizado para estimar os 
parâmetros de modelos racionais do tipo (10.23), com (10.24) e (10.25). 
O presente algoritmo (CORRÊA, 1997) é uma modificação do algoritmo 
originalmente proposto por Billings e Zhu (1991). Assume-se que o modelo 
racional (10.23) pode ser aproximado por 


(9) = MR D o lb my é. sul) 
d y(R=1),.== y(k ny) u(R=1), ==» su(R—nu)) 
+e(e(k-1),... se(k—ne)) + elk), (11.38) 


sendo que o ruído é modelado como sendo um polinômio, podendo ser linear 
ou não. Essa modificação muito simplifica o algoritmo original e em várias 
situações práticas tem dado bons resultados. A consideração básica por 
trás de (11.38) é que o erro de regressão pode ser representado por um 
modelo MA, possivelmente não-linear. Assim sendo, sugere-se o seguinte 
procedimento: 


1. Faça i = 0. Monte a matriz de regressores e estime os coeficientes 
usando MQ 


On | =[urypory, (11.39) 
t 
[ 


sendo que o índice i indica a interação. Além disso, a matriz de 
regressores W € IRNxXNnt+Na-l é formada tomando-se os vetores de 
regressores )n(k — 1) e War(k — 1) ao longo da janela de dados de 
tamanho N, ou seja, 


Valk —1) Vailk —1) 
v= : : (11.40) 


VIRAN 2) 4E(R+N-2) 


Analogamente, o vetor y* € IRNX1 é formado tomando y*(k) sobre os 
dados (ver Eq. 10.26), ou seja, 


yT =[yt(k) (+41) eo yt(kA NO (11.41) 
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2. Paga di = 141, Determine os resíduos c a sua variância, respectiva- 


mente, como: 


T(k = 1)ô, 
eq = ut) — — Sat =D 


(03) = 
= Md jzma+l 


sendo que N é o tamanho dos dados e ma = max(nyMu,ne). 


s 


VI=D | of | 


se (ein), 


(11.42) 


(11.43) 


Usando-se os resíduos determinados no passo 2, atualize W?W e WTy* 


usando (11.44), a seguir. Além disso, atualize (no caso de i = 1, essa 


matriz deverá ser formada) a seguinte matriz: 
valk=1)  u(kba(k =) 
= é i 
Wa(k+N—2) 


Velk—1) 


vips EAN=2) VIA N=2) 


(11.44) 


sendo que Ve! é 0 vetor de regressores do modelo de ruído. Pelo fato 
de o ruído não ser medido, os resíduos calculados no >. passo 2 são 
utilizados. É interessante observar que os elementos 1 paipa; são 
aproximações de Nr, sendo r o coeficiente de correlação entre os 


regressores pai € Pdj- 


4. Determine 


U(k) Dica Pão 


$=/0.,.. 0 


0... O y(h) Dbcipanapar ++ 


0 O is 


vík) Du Paran O 


v(k) Diu Pim, OU sas 
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0 
0 
o sal 
d= =U(K) Dp=1 Paapar (11.45) 
=y(k) Dk=1 PangPai 
0 
0 


e estime novamente os parâmetros usando 


E | = [DP — (62 pWTy* — (629) (1146) 


di 


5. Volte ao passo 2 até atingir convergência (de parâmetros ou de vari- 
ância de resíduos). 


O procedimento acima é simples de entender, mas é inadequado para 
implementação pelo fato das Eqgs. 11.39 e 11.46 serem tipicamente mal con- 
dicionadas. Além disso, no passo 1 assumiu-se que os regressores do modelo 
haviam sido previamente escolhidos. Na prática, essas duas dificuldades po- 
dem ser resolvidas usando-se os algoritmos descritos para o caso polinomial, 
nas Seções 11.2 e 11,3, 

O vetor de regressão [py ...PNn+Na-1]" forma um conjunto de vetores de 
base, e a solução de mínimos quadrados Ô satisfaz a condição de que Vô é a 
projeção de y* na hipersuperfície gerada por tais vetores de base, como visto 
no Capítulo 5. A solução ortogonal, portanto, envolve a transformação do 
conjunto de vetores originais para um outro conjunto de vetores ortogonais. 
Isso permite calcular a contribuição individual de cada vetor de base à saída 
e à sua respectiva taxa de redução de erro, 

A matriz de regressão Y pode ser decomposta como Y = QR, sendo que 
R e Ret Na-D2No+Na-l 6 uma matria triangular. R tem 1's na diagonal 
principal e 0's debaixo dela. Q é uma matriz com colunas, q;, ortogonais 
e dimensão N x (Ny + Ny — 1) de tal forma que QTQ = D, sendo D uma 
matriz diagonal. 

Uma vez que o espaço gerado pelo conjunto de vetores de base ortogo- 
nais, qi, é o mesmo gerado pelo conjunto de vetores originais, pi, à equação 
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de regressão (10.26) resulta na seguinte equação matricial quando tomada 
sobre os dados 


y=QB+6, (1147) 


sendo que é é o vetor de erro da equação de regressão. A solução obtida 
pelo estimador MQ, &, pode ser calculada usando 
q 


t 
Toa: * 


Qi; Qi 


8=D'Q'y'orã= 1Si<(M+Na-1). (11.48) 

O conjunto original de parâmetros 8 pode ser recuperado resolvendo-se 
o seguinte sistema triangular; Rô = g. 

Como visto na Seção 11.3, uma das grandes vantagens de se utilizar 
estimadores ortogonais é que os regressores mais importantes podem ser 
escolhidos no procedimento. Neste particular vale notar que para o caso de 
modelos racionais há dois conjuntos independentes de termos candidatos, 
um para o numerador e outro para o denominador. Mas a forma de se 
escolher tais termos utilizando-se a taxa de redução de erro é análoga à 
discutida para os modelos polinomiais. 


Exemplo 11.4.1. Mapa de conversor CC-CO buck 


Este exemplo considera um modelo racional estimado a partir de dados 
gerados por um modelo de um conversor CO-CC do tipo buck. O mapa 
obtido a partir das equações do circuito tem a seguinte forma (T'sE, 1994): 


h(dn BEE — ylk — 1)] 

Hai) cio io Aun 11.49) 
ylk—1) 

sendo a=0,8872, P = 1,2 e E = 33 constantes que dependem apenas dos 


componentes do circuito eletrônico, dn é um sinal de tensão que implementa 
a ação de controle e a saturação (dy) é dada por 


ví) = oylk — 1) + 


0 se dn <0, 

hdn)=41 se dn >1, (11.50) 
dn caso contrário. 

Modelos polinomiais não resultam em bons modelos para a dinâmica do 

mapa (11.49). Um modelo com estrutura ad hoc, que aproxima relativa- 


mente bem a característica estática não-linear do conversor, é (AGUIRRE, 
1997): 


?CorRêA et al., 2000. 
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ay(k-1)2-by(k—1)+c 
vlk — 1) 


sendo a = 2,6204, b = 99,875 e c = 1,4171x 10º. Por outro lado, o seguinte 
modelo racional 
v(k) = bx(8,658 +0,1223x10-2y(k — 1)º 
=0,441x10-!y(k — 1)2), 


y(k) = 46,429exp[22 — y(k — 1)] + » (11.51) 


(11.52) 


D = 1-0,8381x10-ly(k- 1) +0,1766x10-2y(k — 1)2, (11.53) 


aproxima bem a dinâmica em questão. A Figura 11.1 mostra o mapa de 
primeiro retorno construído usando-se os dados de identificação, bem como 
o mapa obtido simulando o modelo racional (11.52). [m] 


FIGURA 11.1: Mapas de primeiro retorno de conversor buck 


Eixo z é y(k) e eixo y é y(k + 1), ambos em volts. Mapas de 
primeiro retorno de (11.49), pontilhado denso; do modelo (11.52), 
pontilhado leve; do modelo (11.51), traço-ponto. À reta 7 =y é 
também indicada. 


11.5 Estimadores com Restrições e Multiobjetivos 


Esta seção descreverá brevemente dois estimadores relacionados ao estimador 
MQ. As novidades nestes estimadores é que há restrições ou mais de um 
objetivo sendo levado em conta durante o processo de estimação de parã- 
metros, Tais estimadores serão utilizados para resolver problemas de iden- 
tificação caixa cinza no Capítulo 15. 
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11,5.1  Estimador MQ com restrições 


O estimador de mínimos quadrados com restrições (MQR) foi apresentado 
no Complemento 5.3 e será brevemente descrito aqui por conveniência. 

O estimador MQR apresenta-se como uma alternativa para minimizar 
uma função custo Juq = €7€ restrita por um conjunto de np restrições da 
forma c = $0. O estimador é dado por (DRAPER; SMITH, 1998): 


duqr = (UTW)-IWTy — (WTW)-IST[S(UTW)-!ST]-!(Sômg — 0), 
(11.54) 


em que Y é a matriz de regressores e ômq é a solução de mínimos quadrados 
convencional (5.43), c € IR""Xl e S E IR"rX"o são conhecidos. Em outras 
palavras, o estimador MQR fornece um vetor de parâmetros que minimiza 
Juq e eratamente satisfaz o conjunto de restrições c = S0, ou seja, o 
estimador MQR resolve o seguinte problema 


ôuqr= argmin [EE] 
0:c=S0 l pipas) 


É importante notar que o valor da função custo atingido pelo estimador 
MQ será em geral menor do que o respectivo valor atingido pelo estimador 
MQR. Portanto, quando se diz que o estimador MQR minimiza Jmq restrito 
a c = $0, deve-se entender que a função custo será minimizada o quanto 
for possível desde que as restrições possam ser simultaneamente atendidas. 

No Capítulo 15 e na Seção 15.3 será ilustrado o uso do estimador MQR 
(11.54) em problemas de identificação que incluirão no modelo identificado 
informação auxiliar. Nesse particular, o leitor é encorajado a considerar o 
Exercício 11.8. 


11.5.2 Estimador com função custo composta 


Nesta seção será descrito um estimador que minimiza uma função custo 
que, por sua vez, é composta de outras funções custo. Se cada uma dessas 
funções for interpretada como sendo um objetivo, o estimador a ser apre- 
sentado fornecerá uma solução de compromisso entre tais objetivos e, em 
função disso, é frequentemente chamado de estimador multiobjetivo. Es- 
ta seção foi escrita tendo-se por base o trabalho de Nepomuceno (2002). 
Posteriormente, Barroso (2006) estudou o caso bi-objetivo com detalhes. 
Considere-se uma função custo composta da seguinte forma 


de= BRO) (11.56) 
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sendo que, para maior clareza, decidiu-se indicar de forma explícita a de- 
pendência das funções de custo J; com o vetor de parâmetros estimados, 
8. Claramente, (11.56) é uma soma ponderada de n funções custo — Jg é 
uma função custo composta — sendo que se os pesos satisfizerem 


n 
w; 20; e Suw=1, 


fala-se no problema de ponderação P,, no qual o objetivo é achar um vetor 
de parâmetros tal que 


de= argmin Ss uwiJi(ô), 


SS) (11,57) 


em que D representa o conjunto factível do problema. A solução (11.57) 
pode ser usada no presente caso por se tratar de um problema convexo. O 
seguinte teorema fornece uma solução para o problema em (11.57) quando 
Ji forem funções quadráticas de 8. 


Teorema 11.5.1. (NEPOMUCENO, 2002). Sejam os n funcionais 


Jô) = (vi-G)(w- Gi), i=1,...,n, 


em que Ô € RX! é o vetor de parâmetros a estimar, e o vetor v; E RºvX1 
e a matriz G; E R'»X"9 são constantes. O problema 


de= argmin Jo(ô)= arg min DE uidi( 8), 
0€ED 0ED (11.58) 


em que w; € R*, tem por solução 
n -1 n 
B wato] B uictul p (11.59) 
i=t i=1 


Demonstração, 
Os funcionais podem ser escritos como 


J(Ô) = vvi-vIGiô —- 0" GTv; + O GIc;ô (11.60) 


e substituindo (11.60) em (11.58), tem-se 
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de= agmin Di w(vivi- vrGid - 0"GTv; + 0 Grid). 
9eD 


A fim de resolver o problema acima, é necessário achar os valores de Ô 
tais que 


0Jc(ô) 0 
if) 

2 A 
SDuwil-GFvi — Givi+267G;0) = 0 
i=l 

n n E 
> -2mGTvi+3) 267Gô = 0 
i=l i=l 
n n 
SE 2:67 G;0 = bo 2w;G7 vi 
i=l i=l 


n n 
p w;G; a] ô = e wi; Vi 
i=1 E RE 
ô D wo] D vira) é 
i=1 


i=l 


] 


Para que Ô seja o mínimo, é necessário verificar que 


2 PJc(ô, 
DD 2wG7G; = a 150. (11.61) 


i=l 


Como, por definição, w; > O e por construção G7 G; é positiva definida, 
a condição (11.61) é satisfeita, [a] 


O problema do Teorema 11.5,1 apresentado em (11,58) pode ser escrito 
em forma matricial tomando-se 


cuja solução, também na forma matricial, pode se escrita como 
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w 0 G1 
de = |[GT...G7] Ê x 
0 Un Gn 
w 0 vi 
[G1...Gn] “e ; | (11.62) 
0 Un Vn 


No Capítulo 15 e na Seção 15.3 será ilustrado o uso do Teorema 11.5.1 em 
problemas de identificação que incluirão no modelo identificado informação 
auxiliar. 

11.5.3 Estimador bi-objetivo 


Em problemas de otimização bi-objetivo, em geral, não há uma única solu- 
ção que simultaneamente minimize as duas funções de custo envolvidas. Em 
vez disso, encontra-se um conjunto O* de soluções 9*. Esse conjunto recebe 
o nome de Pareto-ótimo e é caracterizado por (CHANKONG; HAIMES, 1983) 


9'EO! e (ÃO: J(9)<J(9º) and I(9) £ J(0*)), (11.63) 


em que J(9) é um vetor de funções custo, que incorpora as funções de custo 
(dinâmica e estática) dadas pelas Egs. 5.42 e 10.81 


J(9) = [ Juo(9) Jre(8) )”. (11.64) 


As soluções 8* podem ser encontradas resolvendo o seguinte problema, 
para 0 < À < 1 (NEPOMUCENO et al., 2004): 


O(A) = [APTE + (1 QRITQRIT [AVTy + (1— AMQRITF]. (11.65) 


Para cada valor de A, estima-se 0*(A), que pertence ao conjuto Pareto- 
ótimo, As soluções mono-objetivo que minimizam Jpp e Juq são, respec- 
tivamente, encontradas quando À = 0 e A= 1. A solução (11.65) é muito 
conveniente, A matriz inversa que aparece na Eq. 11.65 é típica do estima- 
dor MQ, mas inclui um termo de regularização. 


11.5.4 Decisor de mínima correlação 


Uma vez construído o conjunto Pareto-ótimo, em muitas aplicações torna- 
se necessário escolher um modelo dentre aqueles contidos em tal conjunto. 
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Escolher esse modelo é chamado de etapa de decisão. Barroso (2006) propôs 
um critério baseado em mínima correlação, para escolher o melhor modelo 
sobre o Pareto. Esse critério será descrito abaixo. 

Assim, cada modelo candidato O do Pareto, O*, é simulado de forma 
“livre” (ver Seção 13.2). A simulação livre será indicada por 


d(k) = b"(k— 1)0, (11.66) 


em que W(k — 1) é o vetor de regressores em que os variáveis de saída 
são preenchidas com valores simulados de forma livre. Assim, o erro de 
simulação (livre) é 

n(k) = u(k) — d(k). (11.67) 
Define-se o funcional 


Jcorr(0) = , (11.68) 


Lg 
mm 


em que N é o comprimento da série temporal. Considera-se que haja um 
modelo com vetor de parâmetros 8 que corresponde exatamente ao sistema 
e conjectura-se que 


Jcorr(8) < Jeorr(8) VÔ + 0. (11.69) 


Em outras palavras, quanto melhor estimado for o vetor de parâmetros, 
menor será o índice Jcorr(9). Essa parece ter sido também a motivação 
fundamental utilizada por Piroddi e Spinelli (2003), ao abordar o problema 
de determinação de estrutura de modelos. Portanto, o modelo escolhido é 
a solução do seguinte problema (ver Exercício 11.9): 


min Jor(ô). 11.70 
deg nim 


Detalhes desse método, que será ilustrado a seguir, podem ser encontra- 
dos em (BARROSO, 2006; BARROSO et al., 2006). 


Exemplo 11.5.1. Estimador bi-objetivo: o caso de erro na saída * 
O seguinte modelo foi utilizado para gerar dados dinâmicos: 


uk) = 1,1031w(k — 1) + 0,0160u(k — 1)u(k — 2) + 0,0404u(k — 1)2 
—0,2057w(k — 2) — 0,0176u(k — 2)w(k — 1) 
-0,0018u(k — 2)w(k — 2) + 0,0056u(k — 2)? 
uk) = uk) +v(k), (11.71) 
*BARROSO et al, 2006. 
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em que v(k) é ruído branco, com distribuição gaussiana de média nula. 
Como visto na Seção 2.6.5, o modelo (11,71) é do tipo erro na saída. Como 
visto no Exemplo 6.3.4, o estimador MQ é polarizado (tendencioso) nesse 
caso, mesmo com ruído branco. No presente exemplo, o ruído v(k) será 
tomado com desvio padrão correspondendo aos seguintes níveis de ruído: 
1%, 3%, 5% e 7%. Assim, o modelo (11.71) foi simulado com uma entrada, 
do tipo ruído branco, com N = 500, mas com distribuição uniforme com 
média uy = 0,5 e desvio padrão o, = 0,25. As condições iniciais foram 
v(1) = 0,1912 e y(2) = 0,1946. 
A função estática do modelo (11,71) é 


w = 0,062052 — 0,019417 + 0,897410. (11.72) 


O uso direto de (11.72) para produzir dados em estado estacionário baseia- 
se na consideração que tais dados são menos ruidosos do que os dados 
dinâmicos. Assim, a Eq. 11,72 foi utilizada para produzir ns = 10 valores 
em estado estacionário. Na prática, isso pode ser conseguido tomando- 
se a média temporal ao longo de uma janela de dados aproximadamente 
constantes (ROLLINGS et al., 2006). Posteriormente, pode-se construir uma 
função custo como (10.81) com w no lugar de y. 

O conjunto Pareto-ótimo foi construído a partir dos seguintes valores de 
A (veja Eq. 11.65) 


X=[01 01+4, 014244 ... 1,0), (11.73) 


em que o incremento foi A, = 0,9/14. 

Subsegiientemente, cada modelo sobre o Pareto foi submetido a simula- 
ção livre e a respectiva saída foi utilizada para calcular (11.68). O melhor 
modelo foi escolhido utilizando-se o critério (11.70). Esse procedimento foi 
repetido 500 vezes na forma de uma simulação Monte Carlo. Ao fim de 
cada realização, um modelo era escolhido utilizando-se (11.70). Os mode- 
los foram indicados com números de 1 a 15, de acordo com sua posição no 
Pareto, Esses resultados são mostrados na Figura 11.2, 

É importante notar que os modelos indicados por 1 normalmente são 
boas soluções, pois neste exemplo a exata função estática do modelo foi 
utilizada para produzir os dados em estado estacionário. 

Para o nível de ruído mais baixo (1%, Fig. 11.2), a polarização do 
estimador MQ não é fortemente perceptível em todas as realizações. Por 
essa razão, em torno de 150 realizações a solução MQ, que usa apenas dados 
dinâmicos, produziu os melhores modelos. Como esperado, também em 
várias realizações (aproximadamente 150), os modelos em que os dados em 
estado estacionário receberam grande peso durante sua estimativa também 
estavam entre os melhores. Deve ser lembrado que, se não houvesse ruído 
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nenhum, o estimador MQ não é polarizado e produziria a solução exata, 
que também satisfaz exatamente os dados em estado estacionário. Essa 
característica, que não configura dois objetivos conflitantes, é perceptível 
no fato de o histograma apresentar dois picos, um em cada extremo. 


(a) 


(e) 


150 


100 


() 5 10 15 
posição do modelo no Pareto 


(b) 
200 


100 


o 
o 
S 


15 


(9) 


o 


5 10 15 
posição do modelo no Pareto 


FIGURA 11.2: Histogramas de melhores modelos: o caso de erro na saída 


O critério de escolha foi (11.70). O nível de ruído considerado 
foi de: (a) 1%, (b) 3%, (c) 5%, e (d) 7%, (note a diferença de 
escalas no eixo vertical). Os modelos indicados por 15 correspon- 
dem à solução do estimador MQ utilizando exclusivamente dados 


dinâmicos. 


À medida que o ruído nos dados dinâmicos é aumentado, o viés do 
estimador MQ manifesta-se de maneira mais forte e o decisor começa a en- 
contrar melhores modelos entre os extremos (Figuras 11.2b-c). Finalmente, 
para o maior nível de ruído simulado (Figura 11.2d) o viés do estimador MQ 
se faz sentir fortemente (em praticamente nenhuma realização a solução MQ 
foi escolhida a melhor) e, além disso, pelo fato dos dados em estado estaci- 
onário serem limpos, muitos modelos nos quais tais dados recebem o maior 


peso foram os melhores de acordo com o critério (11.70). 


[| 
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No próximo exemplo, será considerado o caso de erro na equação, para 
o qual o estimador MQ não é polarizado no caso de ruído branco. 


Exemplo 11.5.2. Estimador bi-objetivo: o caso de erro na equação é 


No Exemplo 11.5.1 foi visto que o decisor de mínima correlação “perce- 
be” que a solução MQ no caso de ruído branco na saída não é a melhor em 
geral. O objetivo deste exemplo é, em certo sentido, dual, ou seja, deseja-se 
verificar se o decisor de mínima correlação escolhe uma solução que sabi- 
damente é melhor em geral. Para esse fim, este exemplo investigará o caso 
de erro branco na equação de regressão, para o qual o estimador MQ é 
sabidamente não polarizado (ver Seção 6.3.2). 

Os dados dinâmicos foram produzidos simulando-se o modelo 


vlk) = 1,1031y(k — 1) + 0,0160u(k — 1)u(k — 2) + 0,0404u(k — 1)2 
—0,2057y(k — 2) — 0,017Gu(k — 2)y(k — 1) 
—0,0018u(k—2)y(k—2)+0,0056u(k —2)2+v(k), (11.74) 


em que v(k) é ruído branco com distribuição gaussiana. As condições inici- 
ais, a entrada e o comprimento da série de dados foram as mesmas utilizadas 
no Exemplo 11.5.1. A função estática do modelo (11,74) é 


7 = 0,89745 + 0,0620%2 — 0,0194ãj. (11.75) 


Como antes, é importante notar que se algum estimador produzir os 
parâmetros exatos do modelo nominal (11.74) então, por ser um exemplo 
simulado, a função estática (11.75) também será ajustada exatamente. Em 
outras palavras, a minimização de Jrg e de Juq não são objetivos competiti- 
vos, Logo, a fim de tornar os objetivos competitivos— ou seja, a diminuição 
de uma função de custo implicará o aumento da outra— os dados estáticos 
foram produzidos pela seguinte função estática linear: y = 0,27604. Essa 
“curva de calibração” é a reta que passa pela origem (1,7) = (0,0) e pelo 
quinto par de valores em estado estacionário (1,7) = (5,75). Essa equação 
de reta foi usada para produzir ns = 10 pontos em estado estacionário. 

Realizou-se uma simulação Monte Carlo similar à descrita no Exem- 
plo 11,5.1, sendo que os resultados estão mostrados na Figura 11.3. Com- 
parando a Figura 11.3 com a Figura 11.2 torna-se claro que, como previsto 
pela teoria detalhada no Capítulo 6, o estimador MQ não é polarizado 
(tendencioso) no caso de ruído branco adicionado à equação de regressão. 
Deve-se observar como o formato geral dos histogramas na Figura 11.3 não 


*Bannoso et al., 2006. 
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depende do nível de ruído, ao contrário do que foi observado nos histogramas 


da Figura 11,2. [a 
300 (a) 300 da) 
250 250 
200 200 
150. 150 
100 100 
50 50 
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300 300 
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FIGURA 11.3: Histogramas de melhores modelos: o caso de erro na equação 


O critério de escolha foi (11.70). O nível de ruído considerado 
foi de: (a) 4%, (b) 5%, (c) 7%, e (d) 10%. Os modelos foram 
indicados como na Figura 11.2. 


Leitura Recomendada 


Os algoritmos descritos na Seção 11.2 são bastante conhecidos e podem ser 
encontrados tanto em livros (GoLUB; VAN LOAN, 1989), quanto em artigos 
(CHEN et al., 1989). 

Por outro lado, os algoritmos descritos na Seção 11.3 foram especifica- 
mente desenvolvidos por Billings, Korenberg e colegas em uma série de arti- 
gos em que a preocupação básica era resolver o problema de determinação de 
estrutura e estimação de parâmetros, de maneira caixa preta, para sistemas 
não-lineares (KORENBERG, 1985; BILLINGS et al., 1989; KORENBERG et al., 
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1988; RORENBERG; PAARMANN, 1991; BILLINGS; ZHU, 1995). Um algo- 
ritmo semelhante aos descritos na Seção 11.3 foi proposto por Unbehauen 
e colegas (INORTMANN et al., 1988); tal algoritmo usa um índice muito se- 
melhante ao ERR, definido na Eq. 11.21, e permite a remoção de termos do 
modelo, caso os mesmos se tornem irrelevantes à medida que novos regres- 
sores são incorporados. 

Não há duvida de que é vantajoso utilizar o critério da taxa de redu- 
ção de erro (ver Seção 11.3) na escolha de estrutura de modelos lineares 
nos parâmetros. Contudo, esse critério sofre de algumas dificuldades. Em 
particular, foi mostrado que se o sinal de excitação não for um sinal de 
espectro muito amplo (por exemplo, se for um sinal AR) o referido crité- 
rio tem dificuldade de escolher os regressores corretos, em casos em que 
esses são conhecidos (PIRODDI; SPINELLI, 2003). Procedimentos alternati- 
vos, baseados na taxa de redução de erro, foram discutidos em (AGUIRRE; 
BiLLINGS, 1995) e (MENDES; BILLINGS, 2001). 

O estimador com restrições MQR pode ser encontrado em textos clás- 
sicos de regressão (DRAPER; SMITH, 1998). Tal estimador foi utilizado em 
problema de identificação de sistemas com restrições tanto no contexto de 
modelos lineares (PEARSON; POTTMANN, 2000), quanto de não-lineares 
(BARROSO, 2001). O estimador MQR, como será ilustrado no Capítu- 
lo 15, pode ser utilizado para utilizar informação auxiliar na identificação 
de modelos. Essa propriedade é também gozada pelo estimador multiobje- 
tivo (11.59) proposto em (NEPOMUCENO, 2002; NEPOMUCENO et al., 2003, | 
2004). Finalmente, um estudo de caso que fez uso não apenas de uma fun- 
ção custo quadrática, mas também de uma função custo baseada na norma 
infinita, foi descrito em (ADES et al., 2002). 


Exercícios 


11.1, Use a propriedade (11,18) para mostrar que as funções sen(k) e cos(k) 
são ortogonais. 


11,2, Qual é a relação entre (11,18) e a função de correlação cruzada entre 
wi(k) e wj(h)? 


11.3, Use os mesmos dados gerados pela equação logística que constam no 
arquivo exlog O (ou gere-os iterando tal equação, ver Exemplo 11.3.1) e 
identifique um modelo AR. Simule o modelo obtido e verifique se é ou não 
adequado. 


11,4, Quantos regressores (do tipo monômios e multinômios) candidatos 
podem ser gerados para o caso em que não há entrada e considerando-se 
ny=2et=2? 
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11.5. Tome todos os regressores achados no Exercício 11.4 e, usando os 
dados exlog O), estime os respectivos parâmetros. Discuta se é possível 
determinar a estrutura do modelo a partir dos valores estimados. 


11.6. Simule o sistema º 


vlk) = 05y(k—1) +u(k—2) +01 uk —1)+0,5e(k — 1) 
+0,2u(k — 1)e(k — 1) + e(k), (11.76) 


sendo que e(k) é ruído branco com distribuição gaussiana, média nula e 
variância o, = 0,04, e u(k) é uma segiiência independente de e(k), com 
distribuição uniforme, média zero e variância o2=1,0. Considere todas as 
combinações, dois a dois, das variáveis y(k — 1), y(k— 2), u(k — 1), u(k — 2), 
e(k — 1) e e(k — 2). Use alguns dos algoritmos descritos na Seção 11.3 
para escolher os regressores mais importantes. Verifique se a estrutrua do 
submodelo de cinco termos se assemelha à do modelo (11.76). 


11.7. Considere os dados gerados em extended O (ver Exemplo 11.3.3). 
Tente obter um modelo que não tenha regressores exponenciais. Especifica- 
mente, tente obter um modelo que contenha apenas multinômios que sejam 
produto das diversas combinações de y(k — i) e u(k — j) para diversos graus 
de não-linearidade, por exemplo £ = 1,2,3. Compare seu modelo com o 
modelo obtido no Exemplo 11,3.3. 


11.8. Considere os dados em prbsi0 O. Usando o estimador MQ, estime 
os parâmetros de modelos com a seguinte estrutura 


v(k) = axy(k — 1) + aoy(k — 2) + brui(k — 8) + bouo(k — 8), 


em que u(k), uz(k) e y(k) correspondem, respectivamente, às colunas 2, 
3 e 5 do referido arquivo. A seguir, usando o resultado do Lema 10.7.1, 
utilize o estimador MQR para reestimar os parâmetros do modelo acima, 
mas agora garantindo que um dos seus pólos esteja em z = 1. Compare o 
desempenho dos dois modelos e comente criticamente os resultados obtidos. 


11.9. Suponha que a saída de um sistema seja representada da seguinte 
maneira: y(k) = y +e(k), sendo y; a saída ideal (sem ruído) e e(k) o ruído. 
Imagine que haja um modelo para esse sistema, cuja simulação livre é j(k). 
Mostre que o funcional Jcorr(9) é minimizado à medida que j)(k) > yi(k). 
Dica: Substitua (11.67) em (11.68) e considere e(k) ruído branco. 


CHEN et al., 1989. 
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Capítulo 12 


Projeto de Testes e Escolha de 
Estruturas 


12.1 Introdução 


Este e o próximo são, de uma certa forma, os capítulos mais práticos do 
livro. O presente capítulo trata de questões referentes à coleta dos sinais 
necessários à identificação e de como proceder a escolha da estrutura do 
modelo. Deve ser notado que estes são os ingredientes necessários para se 
fazer a estimação de parâmetros, assunto dos Capítulos 5 ao 11. 


Além de muito práticos, os assuntos abordados no presente capítulo são 
bastante subjetivos. É comum ouvir que a Identificação de Sistemas ainda 
é uma arte. De fato, vários aspectos da identificação de um sistema real 
envolvem decisões e escolhas subjetivas. Alguns desses aspectos são abor- 
dados no presente capítulo, sendo que outros serão abordados no capítulo 
seguinte. O Capítulo 16, por sua vez, apresentará o estudo de nada menos 
que 11 sistemas reais, com o objetivo de ilustrar alguns dos conceitos do 
livro, inclusive os aspectos mais subjetivos discutidos neste e no próximo 
capítulo. 


Tendo em vista a subjetividade do assunto, o que se pretende fazer no 
presente capítulo é descrever algumas ferramentas que podem auxiliar em 
decisões que dizem respeito ao projeto de testes, à escolha da estrutura do 
modelo e à determinação da taxa de amostragem. Serão descritos proce- 
dimentos que efetivamente tenham sido de ajuda em problemas reais de 
identificação, vários dos quais serão discutidos no Capítulo 16, em vez de 
descrever longas listas de métodos cujo desempenho em aplicações reais não 
está bem estabelecido. 


Digitalizado com CamScanner 


454 12 PROJETO DE TESTES E ESCOLHA DE ESTRUTURAS 


12.2 Escolha e Coleta de Sinais 


Três aspectos fundamentais em identificação de sistemas são: onde excitar 
a planta, que tipo de sinais usar a fim de obter dados que sejam represen- 
tativos dessa dinâmica e como amostrar tais dados. 

Com respeito a esses tópicos existem algumas diferenças entre modelos 
lineares e não-lineares. Entretanto, as principais diretrizes são válidas para 
ambos os casos. Tais diretrizes são o foco desta seção. 


12.2.1 Escolha de entradas e de saídas 


Ao se buscar um modelo matemático que relacione dinamicamente duas 
variáveis de um sistema, parte-se do pressuposto de que há correlação sig- 
nificativa entre tais variáveis que justifique o modelo. Evidentemente, se 
não houver nenhuma relação de causa e efeito entre duas variáveis, a busca 
de um modelo que as relacione torna-se injustificada. Outro pressuposto 
comum ao se escolher variáveis y(k) e u(k) como saída e entrada de um 
modelo, respectivamente, é que o sinal u(k) é, na realidade, uma causa 
de y(k). Se tais variáveis forem invertidas, o modelo resultante precisaria 
ser não causal para satisfazer as restrições impostas pelos dados. Deve ser 
notado que o fato de duas variáveis estarem correlacionadas não implica 
necessariamente uma relação de causa e efeito. 

Em muitas situações, a escolha das variáveis que serão usadas como 
entradas e saídas é simples de ser feita. Por exemplo, nos casos em que 
se deseja um modelo para a “planta” de uma malha de controle, o sinal de 
entrada é a saída do controlador, ou a variável manipulada, ! ao passo que 
o sinal de saída é a variável controlada. 

Tal panorama, infelizmente, não é tão claro em sistemas onde as malhas 
de controle não são tão óbvias, como, por exemplo, em sistemas biológicos 
ou de economia. Mesmo quando as malhas de controle são conhecidas, se o 
objetivo é obter um modelo multivariável e houver muitas variáveis à dispo- 
sição, não é uma tarefa óbvia escolher quais e quantas variáveis devem ser 
usadas para compor o modelo. Em (LENNOX et al., 2001), ficou constatado 
que a escolha das variáveis de entrada e a correta determinação de atra- 
sos de transporte são cruciais na modelagem de processos. Intuitivamente, 
a função de correlação cruzada apresenta-se como uma ferramenta capaz 
de determinar se há correlação significativa entre duas variáveis candida- 
tas a compor um modelo. Procedimentos mais elaborados podem lançar 
mão de ferramentas tais como a decomposição em valores singulares (SVD) 
ou a análise em componentes principais (PCA) ou, no caso de determinar 


!A escolha entre um sinal e outro determinará se o modelo da planta incluirá ou não 
a dinâmica do atuador. 
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relações de causa e efeito, a causalidade de Granger (BACCALÁ, et al., 1998). 
O uso de funções de correlação cruzada na escolha das variáveis necessárias 
para compor um modelo é ilustrado no próximo exemplo. 


Exemplo 12.2.1. Escolha de variáveis de entrada ? 


. Neste exemplo foram usados dados reais coletados na unidade de tra- 
tamento de águas ácidas de uma refinaria de petróleo. Tais dados foram 
coletados pelo sistema supervisório instalado e se referem a 160 horas de 
operação em condições normais. Uma janela de 1.982 minutos, contendo 
991 observações de oito variáveis do processo, foi usada na análise. Como 
o objetivo final era a obtenção de um modelo que explicasse a temperatura 
no topo da torre de águas ácidas (CRUZ, 1998), tal variável foi automati- 
camente escolhida para ser a saída do modelo. Mas será que as sete variá- 
veis restantes se qualificam como entradas? Haveria redundância entre tais 
variáveis? 

Portanto, calcularam-se as funções de correlação cruzada entre cada 
uma das supostas entradas e a saída. A partir de tais funções, verificou-se 
que duas delas aparentemente não tinham correlação com o sinal de saída. 
Um dos casos em que foi encontrada correlação significativa é mostrado 
na Figura 12,1a, e um caso em que não havia evidência de correlação é 
apresentado na Figura 12.1b. 

Tendo-se definido quais duas entradas não seriam usadas como entra- 
da, resta saber se todas as variáveis que têm correlação com a saída são 
necessárias. O procedimento que foi seguido visava verificar se havia corre- 
lação entre as variáveis candidatas a ser entradas. A indicação de correlação 
entre duas variáveis, ambas correlacionadas com a saída, sugere que apenas 
uma delas seja usada. A Figura 12.1c mostra a função de correlação cru- 
zada entre duas variáveis, ambas correlacionadas com a saída. Como tais 
variáveis estão correlacionadas entre si, há um certo grau de redundância 
entre elas e uma pode ser deixada fora do modelo. 0 


12.2.2 Escolha de sinais de entrada 


No Capítulo 4, foi visto que, a fim de obter a resposta ao impulso de um 
sistema h(k) a partir da função de autocorrelação da entrada ruu(k) e da 
função de correlação cruzada entre a entrada e a saída, a entrada deve- 
ria ser tal que sua função de autocorrelação fosse não-nula apenas para O 
atraso 7 = 0. Sinais com o espectro de fregiiência branco ou quase branco 


2Oruz, 1998. 
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Figura 12,1: Funções de correlação na escolha de entradas 
Funções de correlação cruzada (ab) entre a variável de saída e 


duas variáveis candidatas a serem entradas, (c) entre (outras) duas 
variáveis candidatas a serem entradas. 


satisfazem essa condição, ou seja, sinais aleatórios ou pseudo-aleatórios, 
conforme discutido na Seção 4.9. 

Mesmo quando o método de identificação não fizer uso das funções de 
correlação, as entradas utilizadas deverão satisfazer critérios semelhantes ao 
acima mencionado. Isso pode ser interpretado de duas maneiras distintas, 
mas relacionadas. 

Interpretação numérica. A estimação de parâmetros pode ser interpre- 
tada, basicamente, como a solução de um problema que envolve a inversão 
de uma matriz. No caso do estimador MQ, essa matriz é YTW. No caso de 
modelos com regressores do tipo u(k — j), nota-se que quanto mais cons- 
tante for o sinal de entrada u(k) mais malcondicionada será a matriz a ser 
invertida, uma vez que algumas colunas de Y serão praticamente constantes 
e idênticas (no caso de haver mais de um regressor do tipo u(k — j)). No 
caso de haver duas colunas linearmente dependentes, Y não tem posto pleno 
de colunas e o problema numérico é tipicamente malcondicionado. Sob esse 
aspecto, quanto mais aleatório for o sinal de entrada melhor numericamente 
condicionado será o problema. 

Interpretação dinâmica. Um sinal branco tem potência espectral nu- 
ma ampla faixa de fregiiências. O sistema a ser identificado terá os modos 
dominantes numa faixa finita de frequências. Do ponto de vista desse siste- 
ma, uma entrada será “branca” se ela contiver suficiente energia na faixa de 
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freqiiências dominantes. Portanto, exigir que a entrada seja branca equivale 
a requerer que tal entrada excite a dinâmica da planta. 

Características dinâmicas e estáticas que não forem excitadas não apa- 
recerão nos dados. O que não estiver nos dados não pode ser identificado. 
Tal princípio é utilizado, por exemplo, quando um sistema é excitado em 
torno de um ponto de operação. Nesse caso, como as não-linearidades não 
foram excitadas no teste, é possível, pelo menos em princípio, ajustar um 
modelo linear aos dados assim obtidos. 

Os sinais binários pseudo-aleatórios (PRBS), descritos na Seção 4.3, são 
comumente usados na identificação de sistemas lineares. Entretanto, foi 
argumentado que, do ponto de vista teórico, tais sinais não são adequados, 
em geral, para identificar sistemas não-lineares (LEONTARITIS; BILLINGS, 
1987a). Para estes sistemas preferem-se sinais aleatórios, porém, como ilus- 
trado na Seção 16.4, é possível identificar bons modelos não-lineares a partir 
de testes que usam sinais do tipo PRBS. 

Na prática, é comum usar um gerador de números aleatórios para gerar 
sinais de entrada persistentemente excitantes de ordem elevada. Na maioria 
dos casos, se a cada tempo de amostragem fosse aplicado à planta um novo 
valor de entrada, a excitação dificilmente seria adequada. Uma regra prática 
que normalmente funciona bem é, tendo-se definido o tempo de amostragem 
(esse assunto será discutido na Seção 12.2.3), manter constante cada valor 
escolhido aleatoriamente por um tempo, em torno de 3 a 5 intervalos de 
amostragem, como ilustrado nas Seções 16.3, 16.5, 16.6 e 16.9. No caso de 
sinais PRBS, a duração do menor patamar deve ser aproximadamente 375 
a 57. 

Em se tratando de sistemas com mais de uma entrada, é fundamental 
que os sinais usados para excitar o sistema não estejam correlacionados entre 
si. É simples perceber que, se os sinais de entrada estiverem correlacionados 
entre si, o algoritmo de identificação não “saberá” a que entrada atribuir 
um determinado efeito observado numa determinada saída. Portanto, para 
modelos multivariáveis, todas as recomendações acima são pertinentes e, 
além disso, as entradas não devem estar correlacionadas entre si. 

No caso de identificação de sistemas não-lineares, muitas vezes será de- 
sejável excitar o sistema numa larga faixa de amplitudes a fim de poder 
observar suas características estáticas e dinâmicas. Na prática, nem sem- 
pre é possível excursionar o sistema numa ampla faixa de operação. Nesse 
caso, pode-se contentar com modelos lineares ou, alternativamente, é pos- 
sível compor uma única massa de dados abrangente a partir de diversos 
testes localizados. Recentemente, foi mostrado que o uso de informação au- 
xiliar é útil para compensar a falta de dados em certas regiões de operação 
(CORRÊA et al., 2002). Ou seja, em certas situações é possível incorporar 
no modelo informação sobre o comportamento do sistema em regiões de 
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operação não visitadas pelos dados. Uma situação prática em que é difícil 
obter dados em determinadas regiões do espaço de estados para processos 
não-lineares ocorre quando o sistema tem uma não-linearidade estática em 
forma de S (por exemplo, processos de pH). Na região em torno de pH=7, 
o ganho do processo pode chegar a ser 150 vezes maior do que para valo- 
res bem menores e bem maiores de pH. Portanto, o sistema passa “muito 
rapidamente” por tais regiões do espaço de estados e, consequentemente, 
nos dados coletados há pouca informação do comportamento do sistema em 
regiões de ganho elevado (DOHERTY et al., 1997). 

Em outras situações, excursões de grande amplitude são inevitáveis na 
coleta dos dados. Tais dados podem ser utilizados na identificação de mo- 
delos não-lineares com características globais, ou seja, modelos que tenham 
uma faixa de validade mais ampla do que modelos lineares. Se for dese- 
jado obter modelos lineares a partir de dados que excursionem o sistema 
real fora da faixa de linearidade do mesmo, pode-se usar o estimador MQP 
atribuindo-se peso menor aos dados que se encontram mais distantes do 
ponto de operação para o qual o modelo está sendo obtido. 

Aqui vale a pena reforçar que a velocidade de um sinal ou, em outras 
palavras, a faixa de fregiências em que um sinal tem potência espectral deve 
ser cuidadosamente escolhida quando o objetivo é excitar a dinâmica (linear 
ou não-linear) de um determinado sistema. Por outro lado, a amplitude, ou 
ezcursão de um sinal, é que leva um sistema não-linear a atingir diferentes 
pontos de operação, revelando assim a característica não-linear do mesmo. 
Por essa razão, quando se objetiva descrever um sistema usando-se mo- 
delos lineares, toma-se grande cuidado em não ezcitar as não-linearidades 
do sistema. No teste de sistemas reais, as amplitudes do sinal de entrada, 
idealmente, devem ser tão pequenas quanto possível. Na prática isso quer 
dizer que a amplitude deve ser a menor que resulte numa relação sinal-ruído 
aceitável. Em função dessa discussão, torna-se evidente que na identifica- 
ção de sistemas lineares normalmente o que é importante é o conteúdo de 
fregiiências no espectro do sinal de entrada, ao passo que na identificação 
de sistemas não-lineares, não apenas o conteúdo espectral, mas também a 
forma de onda do sinal de entrada é relevante, como ilustrado no próximo 
exemplo, 


Exemplo 12.2.2. Sinais de excitação para um oscilador não-linear 
No presente exemplo, considera-se o oscilador de Duffing-Ueda mostrado 
na Figura 12.2. 


Esse oscilador pode ser descrito pela seguinte equação diferencial: 


i+ky+y' = ut), (12.1) 
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sendo que no presente exemplo k = 0,1. Deve ser notado que a saturação 
do indutor é levada em consideração e resulta no termo cúbico na Eq. 12.1. 


1 


FiguRA 12.2: Oscilador de Duffing-Ueda 
Circuito do oscilador de Duffing-Ueda, usado no exemplo 12.2.2. 


Esse oscilador tem sido muito utilizado, com u(t) = A cos wt, para 
testar técnicas de identificação e análise de sistemas não-lineares, uma vez 
que exibe uma diversidade de regimes dinâmicos, que incluem ciclos limite 
e caos, à medida que os parâmetros 4 e w são variados. Por exemplo, 
variando-se a amplitude do sinal de excitação na faixa 4,5 < A < 12, mesmo 
para a fregiiência fixa em w = lrad/s, tem-se o diagrama de bifurcação 
mostrado na Figura 12.3.º 


Na Figura 12.4, por exemplo, mostra-se a resposta do oscilador de 
Duffing-Ueda a uma excitação cossenoidal de fregiência 1 rad/s e ampli- 
tude 4 = 11, que apresenta-se como um sinal aperiódico. De fato, na 
Figura 12.3, vê-se que para À = 11 o regime dinâmico do referido oscilador 
é caótico. 


O uso de diagramas de bifurcação na validação de modelos permite um 
rigoroso teste para verificar se um determinado modelo consegue reproduzir 
os mesmos regimes dinâmicos, para os mesmos valores do sinal de excitação, 
que o sistema original. Em muitas situações práticas o uso de tais diagramas 
está limitado ao fato de nem sempre ser viável obter diagramas de bifurcação 
diretamente de sistemas reais. 


*Um diagrama de bifurcação mostra os diversos tipos de regimes dinâmicos apresen- 
tados por um sistema à medida que se varia um dos seus parâmetros. 
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5 6 7 8 9 10 11 12 


FIGURA 12.3: Diagrama de bifurcação de oscilador não-linear 
Diagrama de bifurcação do oscilador da Figura 12.2, com entrada 
u(t)= Acoste 4,5< A < 2. Nota-se que o oscilador apresenta 
caos para, aproximadamente, 55 < A<59e99<A< 11,6. 
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FIGURA 12.4: Excitação senoidal de oscilador não-linear 


Resposta do oscilador Duffing-Ueda, mostrado na Figura 12.2, 
excitado por (a) u(t) = 11 cos(t), (b) saída, y(t). 


Uma observação importante a ser feita com relação à Figura 12.4 é 
que mesmo sendo excitado por uma única fregiiência, o espectro do sinal 
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de saída do sistema é bastante amplo. Isso é uma característica exclusiva 
de sistemas não-lineares, uma vez que um sistema linear excitado com wo 
necessariamente resultará, em regime permanente, num sinal senoidal de 
mesma fregiiência, conforme demonstrado na Seção 2.4. A consegiiência 
prática é que se o sistema for não-linear, como o do presente exemplo, pode 
ser que tal sistema, para um determinado sinal de entrada, produza muitas 
fregiiências na sua saída. Assim, em alguns casos basta um sinal simples, 
mas de amplitude e frequência bem determinadas, para excitar um sistema 
não-linear razoavelmente bem. De fato, usando-se os dados da Figura 12.4 
é possível obter modelos matemáticos que têm diversas características di- 
nâmicas semelhantes ao do sistema original. Isso é notável, de fato, se for 
levado em consideração que o sinal de entrada tem potência espectral em 
apenas uma frequência. 


Com o objetivo de melhorar as características dinâmicas dos modelos 
identificados, procurou-se excitar o sistema com uma entrada que tivesse um 
espectro de frequências mais amplo. Assim sendo, utilizou-se uma onda qua- 
drada (de mesma fregiiência que o sinal senoidal utilizado anteriormente) 
à qual foi adicionado um sinal aleatório com distribuição gaussiana, média 
nula e variância igual a 9. O sinal resultante é mostrado na Figura 12.5a, 
e a respectiva resposta do sistema, na Figura 12.5b. Os modelos obtidos a 
partir de tais dados, entretanto, apresentavam algumas dificuldades, den- 
tre elas o aparecimento de regimes dinâmicos espúrios e o deslocamento de 
alguns pontos de bifurcação. 


Finalmente, observando-se que a região de bifurcações de interesse no 
presente exemplo está na faixa 4,5 < A < 12, decidiu-se repetir o sinal de 
entrada mostrado na Figura 12.5a, mas com a amplitude da onda quadrada 
aumentando de zero a 12. Os sinais de entrada e saída são mostrados na Fi- 
gura 12.6. A partir desses dados foram obtidos modelos cujos diagramas de 
bifurcação muito se aproximaram do original, mostrado na Figura 12.3. Um 
aspecto importante a ser salientado é que praticamente não há diferença en- 
tre o espectro de fregiências dos sinais mostrados nas Figuras 12.5a e 12.6a, 
uma vez que o que distingue os dois sinais é basicamente a amplitude cres- 
cente na Figura 12.6a. A despeito de não haver diferenças apreciáveis nos 
espectros dos sinais usados para excitar o mesmo sistema, a qualidade da 
excitação foi bastante superior no segundo caso, sendo que isso foi cons- 
tatado pela qualidade da família de modelos obtida a partir dos dados da 
Figura 12.6. Isso confirma o fato de que na excitação de sistemas com não- 
linearidades, nos casos em que tais não-linearidades devam ser incluídas nos 
modelos identificados, o perfil de amplitude do sinal de entrada é também 
de grande importância. D 
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FIGURA 12.5: Excitação quadrada de oscilador não-linear 


Resposta do oscilador Duffing-Ueda, mostrado na Figura 12.2, 
excitado por (a) u(t) onda quadrada de fregiiência 1 rad/s e am- 
plitude +10, com sinal gaussiano de o2 = 9, (b) saída, y(t). 


(a) 


(b) 


ss 
o 300 ' 600 900 


FIGURA 12.6: Excitação de oscilador não-linear 


Resposta do oscilador Duffing-Ueda, mostrado na Figura 12.2, 
excitado por (a) u(t) onda quadrada de fregiiência 1 rad/s e am- 
plitude crescente, com sinal gaussiano de o2 = 9, (b) saída, y(t) 
com T; = 7/30 (sdpi3o. 6 O). 


| 
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12.2.3 Escolha do tempo de amostragem 


A maioria dos sistemas reais são processos contínuos no tempo, ou seja, 
eles existem em qualquer instante. Em diversas aplicações científicas e 
tecnológicas é necessário registrar variáveis contínuas de forma discreta no 
tempo. Tais variáveis devem, portanto, ser amostradas. O período entre 
duas amostras é chamado de período ou tempo de amostragem, Ts. 

A fim de que um sinal amostrado retenha algumas das características 
fundamentais do sinal original, é necessário que o tempo de amostragem 
seja suficientemente curto. O teorema de Shannon diz que um sinal que não 
contenha componentes de fregiiência acima de 1/2Ts pode ser determinado 
unicamente a partir de amostras de tal sinal separadas por Ts. 

Na prática, entretanto, a frequência de amostragem é normalmente 
escolhida entre 5 e 10 vezes maior do que a maior freqiiência de interesse 
contida nos dados, e não apenas 2 vezes maior (chamada de fregiiência de 
Nyquist), como exigido pelo teorema de Shannon. 

Uma vez que freqiências acima da fregiiência de Nyquist, fx = 2/Ts, 
não serão bem amostradas para um determinado valor de Ts, é comum 
utilizar filtros a fim de cortar tais fregiiências e assim evitar ó falseamento 
(aliasing) do sinal. 

Do ponto de vista numérico, se o intervalo de amostragem for muito 
curto, a estimação de parâmetros poderá se tornar malcondicionada. Isso 
pode ser visto observando-se que a matriz de regressores é composta de 
elementos que incluem valores amostrados da entrada e saída em derter- 
minados instantes, ou seja, y((k — 1)Ts), y((k — 2)Ts),... e u((k — 1)T3), 
u((k — 2)T5),... Claramente, se Ts + 0, y((k— 1)Ts) = y((k —2)T5) e, nesse 
caso, as colunas da matriz de regressores tendem a se tornar linearmente 
dependentes (redundantes). 

Na prática, o critério de se escolher a freqiência de amostragem 5 a 
10 vezes a maior fregiiência de interesse no sinal nem sempre ajuda muito, 
uma vez que às vezes o conhecimento de tal fregiiência não existe a priori. 
Outra dificuldade é que, em muitos casos, será desejado verificar se um sinal 
previamente amostrado foi obtido com um tempo de amostragem satisfató- 
rio, À seguir será apresentado um critério simples que tem dado uma boa 
indicação da fregiência de amostragem a usar em diversas situações reais. 

Em primeiro lugar, assume-se que o sinal original y*(k) foi registrado 
utilizando-se um tempo de amostragem muito pequeno, ou seja, muito me- 
nor do que o necessário. Em tais casos é comum dizer que o sinal encontra-se 
superamostrado. A questão passa a ser a definição de uma taxa pela qual 
o sinal observado y*(k) será decimado de forma a gerar o sinal de trabalho 
y(k), devidamente amostrado. Ou seja, deseja-se determinar A € IN de for- 
ma que y(k) = y'(Ak). Para fazer isso, será necessário verificar o grau de 
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correlação (redundância) entre observações adjacentes do sinal y*(k). Deve 
ser observado que quanto mais superamostrado estiver o sinal y*(k) maior 
será a redundância entre duas observações consecutivas. 

A fim de quantificar os efeitos causados pela sobreamostragem do sinal 
y*(k), serão calculadas as seguintes funções de autocovariância, uma linear 
e outra não-linear: 


rel) = Elfo) -7)w(t=7) 70] 
rel) = E[W)- VIE) -n)-V26)), (122) 


sendo que E[:) indica a esperança matemática. Considerando-se o sinal 
y*(k) ergódico, substitui-se a esperança matemática pela média temporal. 
O objetivo de se usar r,.'(7), além de ry-(7), é poder detectar algumas 
correlações não-lineares que porventura estejam nos dados. A escolha da 
taxa de decimação A pode ser feita da seguinte maneira: dado o sinal 
superamostrado y*(k), determinam-se as funções em (12.2) e seus primeiros 
mínimos, Ty Ty! respectivamente. O menor desses mínimos passará a ser 
o valor de trabalho, ou seja, 74 = min[Ty», Type). Nota-se que 7%, é medido 
em número de atrasos. Finalmente, deseja-se escolher À de forma que as 
funções de autocovariância do sinal decimado y(k) = y*(Ak) satisfaçam 


10 < Tm <20, (12.3) 


sendo que Tm é definido para o sinal decimado y(k) de maneira análoga a Th, 
para o sinal original y*(k). Os limites inferior e superior de (12.3) podem 
ser relaxados para 5 e 25, respectivamente, 

Deve ser notado que, à exceção do fator de escala (no eixo de atrasos), 
À, as funções de autocovariância de y(k) e y*(k) são iguais. Ou seja, se 
Tm Satisfizer (12.3), então tem-se 10A < TH < 204, Portanto, supondo-se 
que para um determinado exemplo TH = 150, então taxas de decimação na 
faixa 7 < A < 15 podem ser escolhidas para gerar o sinal de trabalho y(k). 


Exemplo 12.2.3. Escolha do tempo de amostragem 


No presente exemplo, o seguinte sistema de equações conhecidas como 
o sistema de Chua (MATSUMOTO, 1984) 


t=a(y-z- h(2)) mz+(mo-m), z>1 

j=2-yv+za ha)=4 mo, lz|<1 

t=-bBy mz-(mo-m), 2<-1, 
(12.4) 
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com mo==1/7,m=2/7, a =9 e B = 100/7, foi integrado usando-se um 
algoritmo de Runge-Kutta de quarta ordem. Tais dados foram registrados 
usando-se Tg = 0,01 e a Figura 12,7 mostra as funções de autocovariância 
(12.2) de cada um dos sinais x, y e z. 
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FIGURA 12.7: Funções de autocovariância linear e não-linear 


ry(7) para o atrator dupla-volta, calculada a partir das com- 
ponentes (a) , (c) y e (e) z; r,«a'(7) determinada a partir das 
componentes (b) x, (d) y e (£) 2. 
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O sistema de equações (12.4) representa um oscilador eletrônico de ter- 
ceira ordem que apresenta diversos regimes dinâmicos não-lineares, incluin- 
do caos. Para os valores de parâmetros indicados acima, o sistema se acomo- 
da sobre o atrator caótico dupla-volta. Uma análise da Figura 12.7 mostra 
que os sinais z(k) e z(k) podem ser decimados com valores em torno de 
A 8, ao passo que para o sinal y(k) A x 4. Ou seja, o sinal y(k) precisa 
ser amostrado com o dobro da fregiiência do que os sinais z(k) e z(k). Além 
disso, é instrutivo perceber que essa informação está contida na função de 
autocovariância não-linear, pois, se apenas as funções lineares fossem utili- 
zadas, concluir-se-ia que os sinais x(k), y(k) e z(k) poderiam ser amostrados 
fundamentalmente à mesma taxa. A mesma observação é válida com relação 
ao espectro dos sinais, ou seja, tais espectros não revelariam a necessidade 
de se amostrar y(k) mais rapidamente do que os outros dois sinais. 

Diversos testes usando-se dados reais, coletados a partir de uma imple- 
mentação do referido oscilador, confirmaram a necessidade de se amostrar 
y(k) mais fregiientemente do que x(k) e z(k) (AGUIRRE et al., 1997). A 
identificação desse sistema será discutida com detalhes na Seção 16.2. O 


Finalmente, com relação à escolha do tempo de amostragem, deve ser 
observado que em alguns sistemas de controle digital o tempo de amostra- 
gem já está previamente definido. Frequentemente, esse tempo é inferior ao 
que seria determinado usando-se o procedimento acima. Não é aconselhável 
alterar o tempo de amostragem nesses casos, pois corre-se o risco de tornar 
a malha de controle instável. Em tais casos, se necessário, pode-se seguir o 
procedimento descrito acima para determinar um fator de decimação. Por 
outro lado, é concebível ter-se uma taxa de amostragem para 0 estimador 
e outra para o algoritmo de controle. Nesse caso, deve-se levar em conta 
que os parâmetros são função de Ts e que alterar o tempo de amostragem 
requer ajustar o valor dos parâmetros. 


12.3 Seleção da Estrutura de Modelos 


Um dos aspectos mais importantes na determinação da estrutura de modelos 
ARMAX é a escolha da ordem do modelo. 

A necessidade de se escolher um valor adequado para a ordem de um 
sistema pode ser apreciada verificando-se que, se a ordem usada for (muito) 
menor do que a ordem efetiva do sistema real, o modelo não possuirá a 
complexidade estrutural necessária para reproduzir a dinâmica do sistema. 
Por outro lado, se a ordem do modelo for muito maior do que a necessária, 
a estimação de parâmetros será provavelmente malcondicionada. 

O problema de determinação da ordem de um modelo linear é menos 
complexo do que o problema correspondente para um modelo não-linear 
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por dois motivos básicos. Primeiramente, o número de estruturas possíveis 
cresce linearmente com a ordem do sistema se este for linear, mas cresce 
muito mais rapidamente para representações não-lineares. Em segundo lu- 
gar, termos redundantes induzirão cancelamentos de pólos e zeros na função 
de transferência de um sistema linear, ao passo que termos redundantes em 
modelos não-lincares destroem a dinâmica original do sistema. 


12.3.1 Seleção da ordem de modelos lineares 


Se a ordem de um modelo linear for maior do que a ordem efetiva do sistema, 
isso normalmente redunda em cancelamento de pólos e zeros na função 
de transferência do sistema. Tal fato pode ser usado como um meio de 
determinar a ordem do modelo, bastando, para isso, monitorar a posição 
das singularidades do modelo à medida que a ordem é aumentada. Outra 
alternativa faz uso da matriz de covariância dos dados de identificação (ver 
Exercício 12.3). 

Além desse procedimento existem várias outras maneiras de estimar 
a ordem ou o número de parâmetros de um modelo linear. Uma forma 
alternativa usa o critério de informação de Akaike (AIC) definido como 
(AKAIKE, 1974): 


AIC(n9) = NInfo&ro(no)] + 2n0, (12.5) 


sendo que N é o número de dados, Cêro(ng) é a variância do erro de mode- 
Jagem (erro de predição de um passo à frente ou resíduos) e ny = dim(ô] é 
o número de parâmetros no modelo. 

A motivação para (12.5) é a seguinte. À medida que termos são incluí- 
dos no modelo, o número de graus de liberdade aumenta permitindo um 
ajuste aos dados mais exato. Assim, o2..o(n9) diminui à medida que ng 
aumenta. Em particular, se ng for igual ao número de restrições obtidas a 
partir dos dados, a matriz de regressores W é quadrada e o vetor de parâme- 
tros pode ser exatamente determinado fazendo-se À = W-ly, Nesse caso, 
o2rolny) = 0. Evidentemente, o bom senso diz que o fato de a variância dos 
resíduos ser nula não implica que o modelo seja bom. De fato, a partir de 
um determinado momento, à diminuição na variância dos resíduos devido 
à inclusão de um novo termo é insignificante e não justificaria a inclusão 
do respectivo termo. Assim sendo, a primeira parcela de (12.5) quantifica 
a diminuição na variância dos resíduos resultante da inclusão de um termo, 
ao passo que a segunda parcela de (12.5) penaliza a inclusão de cada termo. 
Portanto, se a redução em InfoZ.ro(ng)], devido à inclusão de um determi- 
nado termo, for menor do que o “custo” de incluí-lo, 2ng, ele não deveria 
estar no modelo. Em (12.5), o peso dado à inclusão de um termo é 2. Há 
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diversos outros critérios de informação muito semelhantes a ATC(ng), sen- 
do que eles diferem basicamente em como ponderam as duas parcelas em 
(12.5). Dentre esses critérios citam-se o do erro final de predição (FPE) e o 
critério de informação de Bayes (BIO), 


N- na 
BIC(no) = Nno2.o(n6)] + nolnN, (12.6) 


FPE(n9) = NinfoZo(ng)] + Nin [7 tm) 


que podem ser encontrados em (AKAIKE, 1974; KASHYAP, 1977). 

O índice AIC(ng) normalmente atinge um mínimo para um determinado 
número de parâmetros no modelo nj. Do ponto de vista do critério usado, 
esse número de parâmetros é ótimo. Deve ser lembrado que tal critério é 
fundamentalmente estatístico e não garante necessariamente que o modelo 
com o número “ótimo” de termos seja um modelo válido. 

O uso de AIC(n9) obviamente pressupõe que existe uma ordem predefi- 
nida para incluir os termos candidatos sequencialmente no modelo. No caso 
de modelos lineares isso não é muito problemático e pode-se incluir os ter- 
mos na seguinte ordem. Primeiramente, assume-se que o número de termos 
de ruído é fixo, portanto, com os termos de ruído no modelo, uma ordem 
de inclusão dos demais termos seria: y(k — 1), u(k — 1), y(k — 2), u(k — 2), 
e assim por diante, Quando AIC(n9) passar por um mínimo, ou evidenciar 
um “joelho”, o procedimento pode ser terminado. 


Uso de coeficiente de agrupamento 


Uma forma de determinar a ordem de um modelo linear é usar o conceito de 
agrupamento de termos e o de coeficientes de agrupamento. Na realidade, 
esses conceitos serão mais úteis no contexto de sistemas não-lineares, como 
será descrito na seção seguinte, Entretanto, a fim de familiarizar o leitor 
com o procedimento, ele será inicialmente apresentado para o caso linear 
(AGUIRRE, 1994d). 

Considere o seguinte modelo ARMAX: 


no) = DalT)Ult = RAS (Dude = 00] 
i=l j=1 
ng 
+35 a(o) EL(k — i)T3] + (6). (12.7) 


i=l 


Para facilitar a explicação, suponha que os dados tenham sido medidos 
de um sistema contínuo de segunda ordem, com tempo de amostragem Ts, 
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e que seja usado um modelo de ruído com ng = 1. Então, os seguintes 
modelos de ordem crescente podem ser escritos: 


vt) = aM(To)ylt — To) + di(To)u(t — To) + A (To)Ê(E — To) + Et), (12.8) 


vt) = dUTo)ylt— Ts) + a3(To) lt — 275) + bE(Tou(t — T5) 
+b3(To)u(t — 275) + i(To)E( — To) + El), (12.9) 


o) = ATo)ylt— To) + 0HATo)ult — 275) + a3(To)ylt — 375) 
+W(Moult — To) + bi(Ta)u(t — 275) + 68(Mou(t — 37%) 
+ei(To)(t — To) + Elt), (12.10) 


sendo que t = nT; e n = 0,12... Na Eq. 12.8, foi utilizado Ê(k) para 
representar resíduos que não são brancos, pelo fato de o modelo proposto 
não ter a ordem correta. Por outro lado, apesar das seqiiências de resíduos 
correspondentes aos modelos (12.9) e (12.10) serem diferentes, optou-se pelo 
mesmo símbolo, uma vez que ambas as sequência são, em princípio, brancas. 

Suponha, por enquanto, que o tempo de amostragem seja pequeno o 
suficiente de forma a ser possível escrever 


u(t=— To) = y(t — 275) = u(t — 375). (12.11) 


Expressões análogas podem ser obtidas para u(t) se esse sinal for suficiente- 
mente suave. Portanto, as Eqs. 12.8-12.10 podem ser reescritas da seguinte 
forma: 


v(t) = alo) ylt — T5) + bI(To)u(t — Ts) + ci(To)E(E — To) + E(k) (12.12) 


vt) x (a(To)+as(To)ylt= To) + (Di(TS) +bA(To) Jult— To) + Ci(To)E(E= To) + E(k) 
(12.13) 


vt) = (ai(To) +aiTs) +os(To) (to) + (b(TE) +DS(TO) +DA(TE)u(t—T3) 
+ (Tot — To) + E(R). (12.14) 


Deve ser notado que ai(T;), (a?(Ts) +a3(Ts)) e (af(T:)-+a3(T3)+a3(Ts)) 
são os coeficientes Ly dos modelos (12.8) a (12.10) e serão indicados por 
DH(7,), 2$2(T:) e Dy“(T3), respectivamente. 
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Considerando as Eqs. 12.12-12.14 ao longo dos dados, obtêm-se os se- 
guintes sistemas de equações: 


“a MD um) A) guarm) (2) 
PR [o | É | can 


: : : ' (Ts ' 
vN) 1 LyuN-1) u(N-1) E(N-1)] ato) 3 | am 
v(2) OD ui) (1) (2) 
D22(T, 
va a ny "a se [em o (12.16) 
vin) ) Lyw=1) uN-1) uns] ato 1 [em 
v(2) MD ui) €1) E(2) 
D3(T, 
8 a o) (3) é(3) Ea | 69) (12.17) 
: ; à 3 d(T, : 
va] Lu un eu-n)t SS [em 


Como é(k) não é branco, os parâmetros estimados em (12.15) eviden- 
ciarão o efeito de polarização do estimador MQ. Uma comparação das 
Egs. 12.15-12.17 mostra que os valores estimados dos coeficientes de agru- 
pamentos, em média, satisfarão a seguinte relação: 


ET) + ES) = ES) mem Dm), (ana) 


para valores de q não muito grandes. É importante notar que, na prática, 
os valores dos coeficientes de agrupamentos não são estimados a partir das 
equações matriciais (12.15)-(12.17), mas são obtidos conforme definido e 
ilustrado na Seção 10,5. 

No desenvolvimento acima, para facilitar, escolheu-se ng = 1. Na prá- 
tica, o valor de ng não é relevante desde que seja suficientemente grande 
para garantir que os resíduos sejam brancos, posto que a estrutura do mo- 
delo é adequada. Os resíduos podem ser analisados usando-se a função de 
autocorrelação, conforme será discutido na Seção 13.4. 

Bascando-se na análise precedente, é razoável supor que o coeficiente do 
agrupamento f2, atingirá um valor “correto”, Dy4”"“(Ts) tão logo ny atinja 
a ordem do sistema. Resumindo, antes de atingir a ordem correta tem- 
se Dy(T;) £ Dyo(Ts) em geral. Portanto, o comportamento de Dy(Ts) é 
acompanhado à medida que ny (e possivelmente nu) é aumentado. Na 
prática, uma ordem adequada para o modelo é a primeira para a qual a 
condição 


ET) - EyolT) |< 7 (12.19) 
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é satisfeita, sendo que y < 1. No Complemento 10.4, foi mostrado que se 
um modelo discreto tiver integração (pelo menos um pólo em z = 1) então 
By = 1, Com isso em mente, tem-se o procedimento descrito a seguir: 


1. de posse dos dados u(k) e y(k), k = 1,2,3,...,N, obter uma saída 
modificada calculando-se 


Th) = (k — 1) + y(k — 1), (12.20) 


sendo ij(0) = 0; 


2. começando com um modelo de primeira ordem e aumentando essa 
ordem até Nmax, estimar parâmetros usando, por exemplo, o estimador 
EMQ a partir dos dados u(k) e 9(k), k = 1,2,...,N; 


3. determinar os coeficientes de agrupamento Dj para os modelos esti- 
mados no passo 2, Ou seja, calcular 2; pj” ie iqutdr; 


4. se o primeiro coeficiente de agrupamento que satisfaz 


| Di -1|<y i=1,2,...,Nma (12.21) 


para Dj” (1 <r < max), sendo y < 1, então, uma ordem adequada 
para o modelo ény =r —1. 


A ordem indicada pelo procedimento acima é r — 1 pelo fato de se 
ter adicionado, artificialmente, uma integração no primeiro passo. Se for 
conhecido que o sistema que gerou os dados tem uma integração, então o 
passo 1 torna-se desnecessário e a ordem do modelo, nesse caso, será ny = 7. 

A introdução artificial da integração no passo 1 tem duas vantagens prá- 
ticas. Em primeiro lugar, sabe-se, a priori, que Byo(Ts),V Ts. Em segundo 
lugar, a integração aumenta a robustez do método com relação ao ruído de 
média zero, 


Exemplo 12.3.1. Determinação de ordem * 


Considere o modelo contínuo de um sistema massa-mola linear: 
mit) + cult) + ky(t) = u(t), (12.22) 


sendo m=20, c=k=5. O modelo (12.22) foi simulado usando-se uma roti- 
na de integração de Runge-Kutta de quarta ordem (ver Seção 1.6), dando 


“Aguirre, 1994d. 
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origem a dados “contínuos” (y(t),u(t)) que foram subsegiientemente “amos- 
trados” com período Ts, resultando em duas séries com N = 200. 
Primeiramente, deseja-se verificar o desempenho do procedimento em 
função de valores diferentes do período de amostragem Ts. Usou-se um sinal 
binário pseudo-aleatório (ver Seção 4.3) de 8 bits. A maior componente de 
fregiiência de interesse, nesse caso, está em 0,2Hz. Portanto, um valor 
aceitável para a fregiiência de amostragem é fs = 1/T; = 5 x 0,2 = 1 Hz. 


A ordem do modelo de ruído, ng = 2, foi escolhida observando-se o 
comportamento de £7É para valores crescentes de ng e um valor fixo de ny 
(VAN DEN BOOM; VAN DEN ENDEN, 1974). O desempenho do procedimento 
não depende criticamente de ng. 


A Figura 12.8 mostra Dj, k=j=1,2,... 16, para 1/7; = 0,75, 1 e 2Hz. 
Claramente, percebe-se que o sistema em questão tem ordem 3-1 =2, 
o que pode ser confirmado observando-se a Eq. 12.22. Como seria de se 
esperar, baseando-se na definição de agrupamento de termos, os melhores 
resultados são encontrados para 1/Ts = 2Hz. A despeito disso, o pro- 
cedimento resulta em bons resultados mesmo para taxas de amostragem 
razoavelmente pequenas (1/T = 0,75 Hz) e para valores muito pequenos do 
limiar (y=0,002). 


jd, EA 
4 


3 
ordem do modelo + 1 


FIGURA 12.8: Escolha de ordem (sensibilidade a Ts) 


Coeficiente de agrupamento E; para: (—) 1/T; = 0,75 Hz, 
(--) 1/Ts = 1Hze (+-:) 1/T; = 2Hz. 


A seguir, deseja-se investigar a sensibilidade do procedimento com res- 
peito à relação sinal/ruído (SNR), para o caso 1/Ts = 2Hz. O ruído 
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adicionado aos dados tem distribuição gaussiana com média zero e vari- 
ância o2. 

A Pigura 12.9 compara o desempenho do procedimento acima com cinco 
outros métodos a saber: função de erro e teste do determinante é e critéri- 
os de informação AIC, FPE e BIC, conforme definidos nas Egs. 12.5-12.6, 
respectivamente (VAN DEN BOOM; VAN DEN ENDEN, 1974). 


unidades normalizadas 


AZ 2 3 4 5 8 
ordem do modolo + 1 


(6) 


b 4 4 
B28588 


unidades normalizadas 


b 
b 


FIGURA 12.9: Escolha de ordem (sensibilidade ao ruído) 


(a) coeficiente de agrupamento Dj para: (—) sem ruído, 
(--) SNR=2,9 e (:--) SNR=0,74. Para os demais gráficos: 
(—) teste do determinante, (- -) função de erro, (---) FPE, 
(---) AIC e (-0-) BIC, (b) sem ruído, (c) SNR=2,9 e (d) SNR=0,74. 
As unidades foram normalizadas dividindo-se a segiência de va- 
lores de cada critério pelo maior valor encontrado e subseqiente- 
mente tomando-se 0 logaritmo. 


A Figura 12.9 mostra que o procedimento discutido nesta seção é mais 


PATÊ ESSE ES 
*O método da função de erro consiste em observar o comportamento da função de 
erro (y — Vyubyu)"(y — Vyudyu) para diferentes valores de ny e nu, sendo que Yu 
corresponde unicamente aos regressores de saída e entrada (sem o modelo de ruído). 
Para a escolha de ng este método sugere observar o comportamento de £7€, sendo 

que neste caso usa-se o modelo de ruído. Por outro lado, o método do determinante 
Ser avaliar o quão perto está a matriz YTW de ser singular, para diferentes valores 

le ny e ny. 
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robusto ao ruído. Todos os métodos, à exceção do método do determinante, 
que só dá bons resultados para dados sem ruído, indicam a ordem correta 
para dados sem ruído e com SNR=2,9. Por outro lado, para SNR=0,74 só 
o procedimento baseado em coeficiente de agrupamentos indica o resultado 
correto. [mm 


12.3.2 Seleção da estrutura de modelos não-lineares 


No caso de modelos não-lineares, é muito mais complicado definir uma 
ordem significativa para a inclusão de termos candidatos no modelo, tendo 
em vista o elevado número de termos existentes mesmo para valores relati- 
vamente baixos da ordem. 

Uma maneira de ordenar hierarquicamente os termos candidatos é 
utilizando-se a taxa de redução de erro (ERR) definida na Seção 11.3. Por- 
tanto, tendo ordenado os termos, ainda é necessário achar o ponto de corte. 
Novamente, há várias formas de se fazer isso, mas nenhuma delas é signi- 
ficativamente melhor que as outras em todas as ocasiões. Uma primeira 
estimativa, entretanto, pode ser obtida usando-se o critério de informação 
de Akaike. 


Deve ser notado que a taxa de redução de erro e os critérios de 
informação são complementares entre si. Ambos são, em princípio, ne- 
cessários. Na prática, uma série de fatores, tais como a relação sinal/ruído 
e o tempo de amostragem, influencia o desempenho de tais critérios na 
determinação da estrutura de modelos não-lineares. Sendo assim, é dese- 
jável desenvolver outros procedimentos complementares que sejam úteis na 
prática. 


Uma das vantagens de se usar algoritmos baseados no estimador MQ 
para obter os parâmetros do modelo é que, com os parâmetros, a matriz 
de covariância torna-se disponível, conforme discutido nos Capítulos 6 e 8. 
Nesse caso, é possível verificar se há parâmetros que não sejam estatisti- 
camente significativos. Por exemplo, suponha-se que o desvio padrão do 
k-êsimo parâmetro seja op. Então, assumido uma distribuição gaussiana, 
O k-ésimo parâmetro será estatisticamente insignificante com confiança de 
95% se —20, < O; < 20k. Nesse caso, o respectivo regressor pode ser 
eliminado do modelo e os parâmetros devem ser reestimados. Tal procedi- 
mento se aplica tanto a modelos lineares quanto não-lineares. Na prática, 
entretanto, normalmente são poucos os parâmetros estatisticamente não sig- 
nificativos, e o procedimento acima vale mais como um teste para verificar 
a consistência de todos os termos de um modelo do que propriamente como 
uma ferramenta para determinar a estrutura do mesmo. 
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Um procedimento semelhante, e ainda simples, consiste em eliminar os 
termos do modelo que tenham coeficientes bem menores do que os demais. 
Alguns autores sugerem eliminar qualquer termo que tenha um coeficiente 
menor do que um décimo do anterior, quando ordenados por magnitude de 
parâmetros (KADTKE et al. 1993). Infelizmente, tal procedimento é por 
demais simplista e, para modelos não-lineares, não pode ser considerado 
como eficiente em geral (AGUIRRE, 1994c). 

O procedimento descrito no parágrafo anterior supõe que se um determi- 
nado regressor não for importante para explicar o sinal de saída, o respectivo 
parâmetro será necessariamente pequeno. Tal suposição não pode ser fei- 
ta, em geral, na identificação de modelos não-lineares. Entretanto, quando 
há na estrutura do modelo termos que não são importantes, o algoritmo 
normalmente evidencia isso, conforme será discutido a Seguir. 


Uso de coeficientes de agrupamentos 


O conceito de agrupamento de termos e seus coeficientes foi apresentado na 
Seção 10.5. Uma das utilidades de tais conceitos é na determinação da es- 
trutura de modelos não-lineares, como será ilustrado no Exemplo 12,3.2. A 
motivação básica para o uso de coeficiente de agrupamentos na determina- 
ção de estrutura é que se um termo espúrio for incorretamente introduzido 
no modelo pelo critério ERR, então o próprio algoritmo estimará parâmetros 
de forma a evidenciar que tal termo não é necessário. Uma forma em que isso 
ocorre é estimando-se os parâmetros dos termos de um mesmo agrupamen- 
to, de forma que sua soma, ou seja, o coeficiente do referido agrupamento, 
seja muito pequeno. Tal procedimento lembra a verificação do cancelamen- 
to de pólos e zeros em modelos lineares como uma forma de determinar a 
ordem (VAN DEN BOOM; VAN DEN ENDEN, 1974). Além disso é um pro- 
cedimento mais consistente do que o de simplesmente eliminar regressores 
com coeficientes muito pequenos (AGUIRRE, 1994c). 8 

O procedimento para usar coeficientes de termos na determinação da 
estrutura de modelos não-lineares é simples. Consiste, basicamente, em 
identificar uma família de modelos com um número crescente de termos, es- 
colhidos unicamente pelo critério ERR. A seguir, traçam-se gráficos onde os 
diversos coeficientes de agrupamentos são representados em função do núme- 
ro de termos no modelo. Finalmente, procuram-se, nos gráficos, “indícios” 
que sugiram de que determinados agrupamentos são espúrios. Tais indícios 
são, como será ilustrado no exemplo a seguir, i) inclusão tardia de um certo 
agrupamento no modelo, ii) coeficiente de valor absoluto muito menor do 
que os demais, iii) coeficiente com valores oscilatórios e iv) coeficiente com 


“Tal procedimento é conhecido na literatura como zeroing and refitting (KADTKE et 
al., 1993). 
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valores inconsistentes à medida que alguma variável é alterada, como, por 
exemplo, o nível de ruído, os máximos atrasos e o grau de não-linearidade. 


Exemplo 12.3.2. Determinação de estrutura de Duffing-Ueda 7 


A equação do oscilador de Duffing-Ueda, equação (12.1), foi integrada 
para obter 900 “observações” com período de amostragem igual a Ts=7/30. 
A entrada foi aquela mostrada na Figura 12.6. O diagrama de bifurcação 
da equação do oscilador (12.1) foi mostrado na Figura 12.3. 

Escolhendo-se £ = 3 e ny = ny = 3, uma família de modelos foi iden- 
tificada, com número crescente de termos selecionados pelo critério ERR 
apresentado na Seção 11.3, 

A Figura 12.10 mostra os coeficientes de agrupamentos Ly, D,3, Du € 
Z,s para uma família de modelos com número de termos crescente. 


(a) 

- E 
pad atuem 2d 
0 5 10 15 

(b) 
õ E 
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cof ES sia 
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FIGURA 12.10: Coeficientes de agrupamentos para Duffing-Ueda 


Coeficientes de agrupamentos para o sistema Duffing-Ueda. O 
eixo das abcissas indica o número de termos no modelo. (a) Dy, 
(b) 2,3, (c) Zu and (d) Lys (AGUIRRE; BILLINGS, 1995). 


Com relação à Figura 12.10, vale a pena mencionar os seguintes as- 
pectos. Em primeiro lugar, o primeiro termo do agrupamento 92,3 entrou 
“tardiamente” no modelo (o décimo termo), ao passo que após o quinto 
termo os outros três agrupamentos já estavam representados nos modelos. 
Em segundo lugar, o valor de X,s oscila em torno do zero. Finalmente, o 
valor de E, é pelo menos quatro ordens de grandeza inferior do que os de- 
mais coeficientes de termos, mesmo comparando-se com 2,3, que também 


"AGUIRRE; BILLINGS, 1995. 
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é cúbico. De fato, Djs chega a valores menores que 6x 108, A discussão 
acima sugere que os coeficientes efetivos no presente caso são Ny, Ma e My. 

Portanto, gerou-se um conjunto de termos candidatos tomados apenas 
dentre os agrupamentos efetivos. Procedeu-se à identificação de modelos 
exatamente como antes. O diagrama de bifurcação do modelo de 14 termos 
identificado é mostrado na Figura 12.11, e mostra melhoras com relação aos 
respectivos diagramas dos modelos que continham termos do agrupamento 
espúrio Ns. 

O presente exemplo não apenas ilustrou o uso de agrupamentos de ter- 
mos na determinação de estrutura de modelos não-lineares, mas também 
mostrou que se o tipo de termos num modelo não-linear não for correta- 
mente escolhido, o modelo poderá apresentar regimes dinâmicos espúrios. É 
interessante notar que as “bolhas” que aparecem para 6,8 < A < 8 indicam 
bifurcações do tipo forquilha (supercrítica e subcrítica, respectivamente). 
Observando-se a equação normal que descreve esse tipo de bifurcação, nota- 
se que o sistema deve ter pontos de equilíbrio simétricos. Como discutido 
na Seção 10.6, o fato de se ter termos apenas dos agrupamentos My, Ns e 
Ny, garante a referida simetria, possibilitando ao modelo exibir bifurcações 
tipo forquilha. O mesmo sistema foi identificado usando-se redes neurais. 
No caso de redes, é mais difícil impor a restrição de simetria de pontos fixos. 
Sendo assim, as redes identificadas não exibem as bifurcações forquilha do 
oscilador Duffing-Ueda (CORRÊA et al., 1999). o 


5 6 7 8 9 10 1 


FIGURA 12.11: Diagrama de bifurcação de modelo identificado 


Diagrama de bifurcação de modelo identificado com 14 termos, 
escolhidos a partir de agrupamentos efetivos. 
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Recentemente foi observado que, em alguns sistemas, o fato do 
coeficiente de um determinado agrupamento de termos assumir valores mui- 
to pequenos não implica necessariamente que tal agrupamento é espúrio 
(AGUIRRE; JÁCOME, 1998). 


Leitura Recomendada 


Diversos aspectos do presente capítulo foram abordados, também do ponto 
vista prático, por Mendes (2007). 

Ferramentas como a decomposição em valores singulares (SVD) e a 
análise em componentes principais (PCA), que são análogas, podem ser 
usadas com sucesso para reduzir o espaço de variáveis necessárias para 
caracterizar ou modelar um determinado sistema. Exemplos podem ser en- 
contrados em (MOORE, 1981). Um estudo sobre diversas condições envolvendo 
testes e estruturas de modelos identificados foi publicado em (LENNOX et 
al., 2001). Apesar desse trabalho tratar especificamente de redes neurais, 
os resultados descritos têm aplicação mais geral. 

A determinação ótima de sinais de excitação é um assunto pouco abor- 
dado na literatura, uma vez que o problema só tem solução formal nos casos 
em que são feitas diversas considerações, muitas vezes pouco realistas. À 
excitação ótima de sistemas lineares em situações em que há restrições nos 
sinais de entrada e saída foi estudada em (NG et al., 1977). Leontaritis e Bil- 
lings (1987a) analisaram o problema de excitação de sistemas não-lineares 
de um ponto de vista teórico. Em particular, mostraram que sinais do tipo 
PRBS não são adequados na identificação de tais sistemas, em geral. Eles 
analisaram detalhadamente os casos em que há saturação de amplitude no 
atuador, bem como o limite de potência no sinal de excitação. Por outro la- 
do, como será ilustrado no Capítulo 16, a excitação de um sistema usando-se 
sinais do tipo PRBS não descarta o uso de modelos não-lineares. Pelo con- 
trário, em vários casos práticos, modelos não-lineares foram obtidos a partir 
de dados colhidos durante testes dinâmicos em que o sistema foi excitado 
com sinais binários pseudo-aleatórios. O uso de diversos sinais de entrada 
foi estudado no contexto da identificação de turbinas a gás (CHIRAS et al., 
2001). Um estudo muito interessante sobre como o sinal de excitação afeta 
a estimação de parâmetros (a incerteza associada aos parâmetros estima- 
dos) foi apresentado em (FERNANDES, 2006). Nesse trabalho são fornecidas 
algumas heurísticas úteis no projeto de sinais de entrada. Nessa linha, 0 
trabalho de Bombois e colegas respondem a seguinte pergunta: dada uma 
incerteza de modelagem máxima permitida (para fins de controle), qual é o 
teste de identificação mais “barato” que resultará em modelos identificados 
com incerteza abaixo do referido máximo? (BOMBOIS et al., 2006). 

Questões sobre a excitação de sistemas tendo em vista a construção de 
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modelos não-lineares têm sido investigadas por Piroddi e colegas. Como 
mencionado ao fim do Capítulo 11, foi mostrado que se o sinal de excitação 
não for um sinal de espectro muito amplo (por exemplo, se for um sinal 
AR), o referido critério tem dificuldade de escolher os regressores corretos, 
em casos em que esses são conhecidos (PIRODDI; SPINELLI, 2003). Também, 
o papel do pré-tratamento de sinais de entrada na identificação de sistemas 
não-lineares foi descrito em (SPINELLI et al., 2005). 

Frequentemente, deseja-se saber se é necessário um modelo não-linear 
para representar bem um determinado conjunto de dados. Existem alguns 
algoritmos simples que podem ser usados para se ter uma indicação se há 
ou não indícios de não-linearidades nos dados (HABER, 1985). Dentre tais 
algoritmos, o mais simples consiste em realizar dois testes independentes 
no sistema a ser modelado operando em condições diferentes. Subsegiente- 
mente, procura-se verificar se o princípio da superposição se aplica. Outros 
procedimentos são baseados em funções de correlação cruzada. Por exem- 
plo, seja um sistema cuja entrada e saída são, respectivamente, u(k) e y(k). 
Determina-se a seguinte variável auxiliar: 


c(k) = u?(k) — Efu(k)], (12.28) 


sendo que o apóstrofe significa que a média foi removida do sinal. Portanto, 
a função de correlação cruzada rzy(k) será estatisticamente nula para todos 
os valores de k se o sistema for linear (HABER, 1985). Um outro proce- 
dimento, que não requer o conhecimento do sinal de entrada, consiste em 
calcular 


ryyalr) = Ely (6 + my (K)), (12.24) 


sendo y 2(k) = (y(k) — Ely(k)])2. Portanto, ryyalt) = 0, Vr se o siste- 
ma for linear (BILLINGS; VOON, 1983). O assunto de achar indícios de 
não-linearidade em séries temporais tem sido abordado de forma mais sis- 
temática e sofisticada na área de sistemas dinâmicos não-lineares. O leitor 
interessado pode consultar (TAKENS, 1993) para um tratamento simplifica- 
do do assunto, ou (SCHREIBER; SCHMITZ, 2000) para uma revisão posterior. 

Com relação à escolha do período de amostragem, o procedimento des- 
crito na Seção 12.2.3 foi originalmente proposto em Aguirre (1995c). Sub- 
segiientemente, em (BILLINGS; AGUIRRE, 1995) foram descritos diversos 
resultados que descrevem como o tempo de amostragem afeta o desem- 
penho de modelos identificados, a capacidade de escolher a estrutura de 
tais modelos, utilizando-se a taxa de redução de erro (ERR) definida no 
Capítulo 11, e a estimação de parâmetros. A função de autocovariância 
não-linear mostrada em (12.2) foi originalmente proposta por Billings e Tao 
(1991) no contexto de validação de modelos autônomos. 
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A literatura sobre a determinação de estrutura de modelos é bastante 
vasta, principalmente no que diz respeito a sistemas lineares. Nesse par- 
ticular, van den Boom e van den Enden (1974) comparam cinco métodos 
simples, alguns deles citados na Seção 12.3. Veja também o Exemplo 14.2.1, 
no qual se discute o uso de índices de dominância modal na escolha da 
ordem de modelos dinâmicos. Vários trabalhos nessa área atacam o pro- 
blema usando critérios de informação (STOICA et al., 1986; LEONTARITIS; 
BILLINGS, 1987b), sendo que esta última referência aborda especificamente 
o problema no contexto de sistemas não-lineares. 


Como visto ao longo do capítulo, a escolha de estrutura para modelos 
não-lineares vai além da determinação da ordem. Contudo, se a ordem for 
conhecida fica mais fácil determinar os regressores do modelo, as intercone- 
xões de uma rede e assim por diante. Em função disso, alguns autores têm 
proposto métodos para determinar os máximos atrasos ny e ny necessários 
em modelos NARX (sejam polinomiais ou não). Um exemplo recente que 
usa o conceito de quocientes de Lipschitz e de falsos vizinhos foi proposto 
em (BOMBERGER; SEBORG, 1998). 


No âmbito de sistemas não-lineares, o assunto da completa determinação 
de estrutura ainda não está suficientemente maduro. À primeira referência 
ao método ortogonal de procura rápida (FOS, do inglês Fast Orthogonal 
Search Method), como ferramenta para a solução do problema de escolha 
de estrutura para modelos polinomiais discretos, parece ser (KORENBERG, 
1985). Tal algoritmo foi estendido para modelos vetoriais, ou seja, modelos 
multivariáveis que usam o mesmo conjunto de regressores (funções de base) 
para explicar mais de uma variável, ver Complemento 2.2 (BAGARINAO; 
SATO, 2002). Ao longo do tempo surgiram alternativas ao FOS, com pe- 
quenas variações no algoritmo e no nome, como, por exemplo, a taxa de 
redução de erro (ERR, do inglês Error Reduction Ratio) (BILLINGS et al., 
1988, 1989; KORTMAN; UNBEHAUEN, 1988a) e a soma de regressores ao 
quadrado (Sum of Square Regressor) (KORTMAN et al., 1988). Uma ex- 
ceção parece ser (DESROCHERS; MOHSENI, 1984), em que um algoritmo 
ortogonal, diferente daqueles mencionados acima, foi proposto para selecio- 
nar, dentre uma biblioteca de termos candidatos, os melhores termos para 
compor um modelo não-linear contínuo no tempo. Um outro método di- 
ferente seleciona os termos baseado em análise de correlação (KORTMAN; 
UNBEHAUEN, 1988b). 


O critério baseado na taxa de redução de erro foi aplicado ao problema 
de determinação da estrutura de modelos contínuos, do tipo definido na Se- 
ção 10.2.4, em (AGUIRRE et al., 2001; FREITAS, 2001). Uma boa introdução 
de métodos desenvolvidos até o fim da década de 80 pode ser encontrada 
em (HABER; UNBEHAUEN, 1990). 
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Um procedimento complementar foi proposto baseado no conceito de 
agrupamento de termos e coeficientes de agrupamentos (AGUIRRE, 1994d; 
AGUIRRE; BILLINGS, 1995; AGUIRRE; MENDES, 1996). Tal procedimento 
tem sido usado com sucesso em diversas áreas tais como sistemas dinâmicos 
não-lincares (AGUIRRE et al., 1997; MENDES; BILLINGS, 1998) e processa- 
mento de sinais biomédicos (CORRALES; AUNÓN, 2000). 

Dada a complexidade do problema de determinação da estrutura de mo- 
delos não-lineares, alguns autores têm procurado subdividir tal problema em 
outros dois menores. Feil e colegas (2004) propuseram um procedimento pa- 
ra estimar os atrasos máximos nas variáveis de entrada e saída de modelos 
não-lineares. Por outro lado, Wei e Billings (2004) propuseram um proce- 
dimento para a seleção de variáveis candidatas para comporem um modelo 
não-linear. 

Técnicas de computação evolutiva, e em especial algoritmos genéticos, 
têm sido investigadas no âmbito da determinação de estrutura de mode- 
los não-lineares (FONSECA et al., 1993; MAO; BILLINGS, 1999; COELHO; 
COELHO, 1999), bem como procedimentos de procura mais exaustiva de 
estruturas (MENDES; BILLINGS, 2001). 

Especificamente, com relação a redes neurais artificiais, métodos de poda 
(pruning) têm sido investigados (REED, 1993). Para funções radiais de base, 
a taxa de redução de erro foi aplicada para a escolha dos centros (CHEN et 
al., 1990), que é um dos problemas na determinação de estrutura de modelos 
que usam funções radiais de base (RBFSs). Um extenso trabalho de revisão 
de métodos úteis à caracterização da topologia de redes (não restritos a 
redes neurais) pode ser encontrado em (COSTA et al., 2006). 

Finalmente, uma maneira alternativa de se fazer a determinação de es- 
trutura é usar conhecimento disponível a priori para tal. Tal procedimento 
é chamado de identificação caixa cinza. As dificuldades com esse proce- 
dimento são várias; entre elas citam-se as seguintes: primeiramente, nem 
sempre há informação a priori que possa ser utilizada para a determina- 
ção da estrutura do modelo. Em segundo lugar, mesmo quando há tal 
conhecimento, não é óbvio como ele pode ser utilizado. Em alguns casos 
simples, decisões ad hoc podem ser tomadas (LINDSKOG; LJUNG, 1995), 
mas alguns resultados mais gerais têm sido obtidos usando-se o conceito 
de agrupamento de termos (JÁcOME, 1996; AGUIRRE, 1997; AGUIRRE; 
JÁCOME, 1998; AGUIRRE, 1999). 


Exercícios 


12.1. Considere novamente os dados do arquivo prbsa02 (O mostrados na 
Figura 4.16. Tendo verificado o grau de aleatoriedade do sinal de entrada 
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no Exercício 4.17, o que você faria ao sinal de entrada de forma a aproximar 
sua FAC daquela característica de sinais aleatórios? Observando a figura, 
nota-se que a saída medida parece ter duas fases. À primeira vai do início 
do teste até aproximadamente 3.000 segundos. A segundo vai de 3.000 
segundos até o fim do teste. Discuta as possíveis causas dessas diferenças e 
mencione cuidados que devem ser tomados ao usar essa massa de dados em 
identificação. 


12.2. Use o procedimento descrito na Seção 12.2.3 para verificar se os dados 
do arquivo prbsa02 (O, mostrados na Figura 4.16, precisam ser decimados 
ou não. Em caso afirmativo, determine a taxa de decimação, À, e decime 
os dados. Em média, quantas observações são feitas nos patamares mais 
curtos do sinal de entrada? 


12.3. Seja a função de transferência 


0,1701z + 0,1208 


2 2 0,7859z + 0,3679' ras 


H(z) 


Simule (12.25) para uma entrada u(k), à sua escolha. A partir dos 
dados de simulação Z = (u(1),y(1),... ju(N),y(N)), construa a matriz de 
identificação Z = [Y y], em que Y é a matriz de regressores e y é o vetor de 
saída. Para montar Y, você deverá postular valores para os máximos atrasos 
nas variáveis de entrada e saída, ny e ny, respectivamente. Sabendo que os 
valores verdadeiros para essas duas grandezas são n;, = 2e ny = 2, verifique 
a seguinte afirmativa: “na ausência de ruído, a matriz de covariância dos 
dados de identificação Z7Z tem um autovalor com multiplicidade igual a 
Iemin(ny — NuNy — Ny), Se Nu 2 My E Ny > ny” (CADZOW; SOLOMON, 
1988). 
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Validação de Modelos 


13.1 Introdução 


Após passar pelas diversas etapas que compõem a identificação de um 
sistema real chega-se ao produto final, um modelo ou uma família de mo- 
delos. A pergunta que naturalmente surge, e que precisa ser respondida, 
é: o modelo obtido serve? Ele é suficientemente bom? Em se tratando de 
uma família de modelos, pode-se perguntar: qual dos modelos é o mais ade- 
quado? Tais perguntas, como será visto ao longo do presente capítulo, nem 
sempre são fáceis de responder. Na realidade, será difícil obter respostas 
absolutas para tais questões sendo que normalmente as respostas terão um 
caráter relativo, ou seja, o resultado deverá ser interpretado dentro de um 
determinado contexto. 

Em problemas de validação, a questão-chave é tentar determinar se um 
dado modelo é válido ou não. O único jeito sistemático de verificar isso 
começa necessariamente pela seguinte pergunta: qual é o uso pretendido 
para o modelo? Em outras palavras, é necessário saber como o modelo será 
utilizado de forma a poder julgar se ele incorpora, ou não, as características 
requeridas, Essa necessidade advém do fato de que nenhum modelo, por 
definição, representará o sistema real em todos os aspectos. Portanto, já 
que o modelo provavelmente é representativo do sistema em alguns aspectos 
apenas, ele será considerado válido se incorporar aquelas características do 
sistema que são fundamentais para a aplicação em questão. Por exemplo, 
se um modelo for obtido com a finalidade de se fazer predições, então ele 
6 será válido se a soma dos quadrados dos erros do preditor de k-passos 
à frente for suficientemente pequena, Em outro caso, em alguns problemas 
de projeto ou sintonia de controladores, a capacidade preditiva do modelo 
já não é necessariamente tão importante. 

O objetivo do presente capítulo é descrever algumas ferramentas que po- 
dem ser usadas na verificação da qualidade de um modelo. Deve-se manter 
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em mente, entretanto, que a importância de cada uma dessas ferramentas 
dependerá da aplicação. Além disso, na prática, é recomendável usar di- 
versas ferramentas e tentar validar um modelo considerando um conjunto 
de indicadores em vez de usar um indicador só. Além disso, nem todos os 
métodos são aplicáveis sempre. Finalmente, deve-se notar que, na prática, 
um modelo será válido na medida em que for realmente útil. 


13.2 Simulação 


Comparar a simulação do modelo obtido com dados medidos é provavel- 
mente a forma mais usual de se validar um modelo. Nesse caso, deseja-se 
saber se o modelo reproduz ao longo do tempo os dados observados. Sem 
dúvida, esse procedimento é importante e, em muitas aplicações, não é tri- 
vial obter um modelo cuja simulação se aproxime das observações. Por ser 
relativamente simples, tal procedimento é muito comum. Entretanto, há 
diversos cuidados que precisam ser observados. 

Um cuidado básico é não usar os dados utilizados para obter o modelo 
na validação. A motivação para tal cuidado é simples. Dado um modelo 
obtido a partir de um determinado conjunto de dados, deseja-se saber quão 
geral é o modelo. Em outras palavras, deseja-se saber se o modelo serve 
para explicar um outro conjunto de dados observado do mesmo sistema. É 
comum, portanto, referir-se à capacidade de generalização do modelo. 

Portanto, na prática, o ideal é efetuarem-se dois testes independentes 
ao longo dos quais o sistema é observado gerando-se, assim, dois conjuntos 
de dados. Um deles é usado para a identificação do modelo e o outro para a 
validação. Se dois testes distintos não puderem ser realizados, então divide- 
se o único conjunto de dados disponível em duas partes (não necessariamente 
iguais), sendo que a primeira é usada para a identificação e a segunda para 
a validação. Esses dois procedimentos estão ilustrados no caso estudado 
na Seção 16.9, onde os modelos identificados foram validados na segunda 
metade dos dados de um teste e também usando-se um conjunto de dados 
independente, 

Ao se proceder desta forma, principalmente no caso de se realizar dois 
testes independentes, alguns cuidados básicos precisam ser tomados. Em 
primeiro lugar, como praticamente todos os sistemas reais são não-lineares, 
é importante que os dois testes sejam efetuados com o sistema operando 
em condições semelhantes, principalmente se os modelos identificados fo- 
rem lineares. Isso porque o modelo linear obtido de um conjunto de dados, 
se válido, representará a dinâmica do sistema em torno do ponto de ope- 
ração correspondente ao teste usado. Se o segundo conjunto de dados for 
coletado com o sistema operando em condições diferentes, então a dinâmica 
do sistema provavelmente será distinta, e nesse caso o modelo identificado 
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revelará diferenças com relação às observações quando for validado. Em 
segundo lugar, problemas semelhantes serão observados mesmo se ambos 
os testes forem realizados nas mesmas condições de operação, no caso de o 
sistema ser variante no tempo. 


Exemplo 13.2.1. Validação requer dados específicos ! 


No presente exemplo, serão considerados modelos identificados para um 
pequeno forno elétrico. Esse sistema será considerado em mais detalhes 
na Seção 16.3. Dois conjuntos de dados são considerados aqui, a saber, 
£0307 O e £0407 O, mostrados na Figura 16.13. Ambos os conjuntos de 
dados foram decimados (reamostrados), e dois modelos, um linear e um 
não-linear, foram identificados a partir dos dados £0407 O. A Figura 13.1 
mostra as simulações de ambos os modelos na mesma massa de dados em que 
foi feita a identificação, ou seja, £0407 O. Comparando-se o desempenho 
de ambos os modelos, pode-se chegar à conclusão de que ambos explicam a 
dinâmica do sistema igualmente bem e, portanto, o modelo linear deve ser 
preferido, uma vez que é mais simples. 


—— + 
100 150 200 250 
ttmin) 


FIGURA 13.1: Validação enganosa de modelos de um forno 


Em ambos Os gráficos, o traço contínuo indica os dados medidos e o 
tracejado indica a simulação de modelos identificados. (a) modelo 


não-linear e (b) modelo linear. Foram usados os mesmos dados de 
identificação (£0407 0). 


!RopRIGUES, 1996. 
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O mesmo sistema foi testado em outro dia. Desse teste surgiu o conjunto 
de dados £0307 (O. Os mesmos modelos foram simulados usando-se esse 
conjunto de dados. Os resultados são mostrados na Figura 13.2. 


150 
min) 


FIGURA 13.2: Validação de modelos de um forno 


Em ambos os gráficos o traço contínuo indica os dados medidos e o 
tracejado indica a simulação de modelos identificados. (a) modelo 
não-linear, e (b) modelo linear. Foram usados dados diferentes 
para se fazer a validação (£0307 0). 


A comparação entre as Figuras 13.1 e 13.2 mostra que as deficiências 
do modelo linear não são evidenciadas quando se utiliza para a validação O 
mesmo conjunto de dados que foi utilizado para a identificação. Portanto, 
a validação deve sempre ser efetuada com dados que não tenham sido uti- 
lizados nas etapas anteriores à identificação. [nm] 


Com relação ao uso de predições para validar modelos, é necessário 
observar que é possível simular um modelo de formas diferentes, como des- 
crito a seguir. Suponha-se que o modelo obtido é y(k) =p” (k — 1) + E(k). 
Deve ser lembrado que o vetor de regressores é composto de variáveis toma- 
das até o instante (k — 1). Uma forma de se fazer predição é, no instante 
(k — 1), montar o vetor de regressores 1) com observações obtidas do con- 
junto de dados e simplesmente calcular j(k) = bT(k — 1)ô. O valor predito 
para o instante seguinte, ou seja, k, é (k). Por essa razão, tal predição é 
denominada de predição de um passo à frente, sendo que WT(k — 1)9 é o 
preditor de um passo à frente. Para obter a predição de um passo à frente 
para o instante (k + 1), tomam-se observações do conjunto de dados até o 
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instante k, ou seja, 9(k + 1) = 4” (k)Ô. O ponto-chave a ser notado aqui 
é que a predição de um passo à frente anteriormente obtida, j(k), não é 
utilizada para obter a predição de um passo à frente seguinte, j(k + 1). 
Nesse caso, o erro de predição é claramente y(k) — (k) que, por definição, 
é o resíduo no instante k. Se for lembrado que os algoritmos de estimação 
de parâmetros normalmente minimizam a soma do quadrado dos resíduos, 
torna-se evidente que, graças a tais algoritmos, para um determinado con- 
junto de regressores definidos em bp” (k—1) os erros de predição de um passo 
à frente serão sempre os menores possíveis. Consegientemente, predições 
de um passo à frente não são um bom teste para validar modelos, uma vez 
que modelos ruins normalmente apresentam predições de um passo à frente 
boas. Cabe aqui um alerta: na literatura de modelagem em geral, o uso de 
predições de um passo à frente para validar modelos é relativamente comum. 
O leitor deve, portanto, interpretar com cuidado resultados aparentemente 
promissores se os mesmos tiverem sido “validados” com predições de um 
passo à frente. 


Exemplo 13.2.2. Influência do tipo de simulação 


Considere a Figura 13.3 abaixo, que mostra as predições de um passo à 
frente de um modelo identificado. 


75) 


as 


] 100 


150 
Umin) 


Figura 13,3: Validação de modelos de um forno 


O traço contínuo indica os dados medidos e o tracejado indica 
a simulação de um passo à frente do modelo linear usando-se os 
dados de validação (0307 (Q). Comparar com a Figura 13.2b, 
onde foi feita a simulação livre. 


Digitalizado com CamScanner 


488 13 VALIDAÇÃO DE MODELOS 


O presente exemplo volta a considerar o modelo linear mencionado no 
Exemplo 13.2.1, em que as simulações mostradas nas Figuras 13.1 e 13.2 são 
as predições livres dos modelos identificados. Usando-se o mesmo modelo 
linear e o conjunto de dados (£0307 (0), foram obtidas as predições de um 
passo à frente mostradas na Figura 13.3. 

Evidentemente, percebe-se que as predições de um passo à frente não 
conseguem evidenciar claramente as deficiências do modelo linear, ao passo 
que a simulação livre, mostrada na Figura 13.2b, mostra claramente que o 
modelo linear tem dificuldades em explicar os dados observados. Portanto, 
como regra geral, tem-se que predições de um passo à frente não são bons 
indicadores da capacidade de o modelo explicar a dinâmica do sistema. O 


Uma outra forma de simular um modelo é reutilizar predições passadas 
para compor o vetor de regressores a fim de continuar fazendo predição, A 
fim de ilustrar esta idéia, considere o caso hipotético em que o modelo a ser 
simulado tem o seguinte vetor de regressores: 


WT(k = 1) = [y(k 1) v(k — 2) u(k — 1) u(k — 2). 


Para efetuar a simulação, é necessário inicializar o modelo com valores 
medidos. Chamando y(1) e y(2) os dois primeiros valores do conjunto de 
dados de validação, juntamente com as entradas u(1) e u(2), tem-se 


9(3) = [y(2) v(1) u(2) u(1)]ô. 


Aproveitando a predição 9(3) para prosseguir, tem-se 


) = [9(3) v(2) u(3) u(z 


4 (2 
5) = [9(4) 0(3) u(4) u(3)]ô 


= 
— 


e assim por diante. O sinal simulado desta maneira é chamado de simulação 
livre ou predição de infinitos passos à frente. Deve ser notado que ao simular 
modelos para validação, o sinal de entrada usado sempre será o sinal de 
entrada medido. Esse procedimento é, ao contrário da predição de um 
passo à frente, uma boa maneira de testar se o modelo consegue explicar as 
observações feitas. 

Evidentemente, o preditor de um passo à frente e o preditor livre são 
dois casos extremos. O caso intermediário é chamado de preditor de k 
passos à frente e consiste em usar o modelo como preditor livre apenas 
por k intervalos de amostragem, reinicializando-o logo a seguir com dados 
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medidos. Para ilustrar esse tipo de preditor, considere o modelo anterior e 
suponha que se deseje calcular as predições de três passos à frente. Portanto, 
tem-se 


bu) = [v(2) vu) u(ijô 
[:(3) v(2) (3) u(z)ô 
[a(4) du(3) (4) u(3Jô, 


ss 
Ea ml 
nu 


sendo que 71(3) é a predição de um passo à frente, 72(4) é a predição de 
dois passos à frente e fj3(5) é a predição de três passos à frente, conforme 
indicado pelos subíndices. A fim de que 1)(6) também seja uma predição de 
três passos à frente, deve-se calcular 


dn(a) = [u(3) v(z) u(3) u(ajô 
dn(o) = [bi(4) v(a) ua) u(a)ô, 
dolo) = [bn(6) di(4) u(5) u(a)jô, 


e assim por diante. Portanto, um gráfico das predições de três passos à 
frente é composto por 93(5), 93(6), e assim sucessivamente. Em problemas 
de controle adaptativo o uso de predições de k passos à frente é comum 
(LAGEs; HEMERLY, 2007). 


Exemplo 13.2.3. Predição de seis passos à frente 


No presente exemplo, considera-se uma série temporal de preços a ser 
discutida com maiores detalhes na Seção 16.10. O objetivo do presente 
exemplo é mostrar predições de seis passos à frente de um modelo NARX 
(ver equação (16.38)). O tempo de amostragem dos dados é de um mês, de 
forma que a predição de seis passos à frente corresponde a predizer o futuro 
que dista seis meses da última observação feita. A Figura 13.4 mostra o 
desempenho do mesmo modelo (16.38) na predição de dados em épocas 
distintas. 

A observação da Figura 13.4 revela que o modelo (16.38) é válido nos 
períodos correspondentes às janelas DS-II e DS-V (ver Seção 16.10 e Fi- 
gura 16.47 para detalhes), mas não é válido no período correspondente à 
janela DS-IV. [nm] 


É importante fazer uma última observação com relação a predições. Em 
todos os exemplos acima mencionados os modelos eram puramente determi- 
nísticos, no sentido de que a parte MA de tais modelos, usada para reduzir 
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a polarização na etapa de estimação de parâmetros (ver capítulo 7), não foi 
usada na simulação. Vale mencionar que em algumas aplicações, em pro- 
blemas de predição k passos à frente para k tipicamente menor do que três, 
usa-se a parte MA do modelo para se obter o valor estimado j. Em tais 
casos, os próprios resíduos do modelo podem ser usados, bem como pode-se 
usar outra variável aleatória com as mesmas propriedades dos resíduos. 


FIGURA 13.4: Predição de seis passos à frente 


Dados observados sem tendência e predições de seis meses à frente 
do modelo (16.38) sobre as janelas de dados (a) DS-II, (b) DS-V 
e (c) DS-IV (AGuiRRE, AGUIRRE, 2000). 


Dois índices usados na quantificação de predições são definidos a seguir: 


Dêelulk) = 9(6)2 
VEL ut) 92 


sendo que f(k) é a simulação livre do sinal e j é o valor médio do sinal 
medido y(k), sendo que a média é calculada na janela de identificação. 
Outro índice parecido é 


RMSE = (13.1) 


Disalulk) = dk)? 
Dsi(ulh) — (ke — 1)? 
sendo que i indica o horizonte de predição, normalmente pequeno, medido | 


em intervalos de amostragem. A interpretação das equações (13.1) e (13.2) | 


| 
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é simples. No primeiro caso, o índice compara as predições do modelo com 
a média temporal do sinal. Ou seja, a média é usada como preditor trivial. 
Semelhantemente, RMSE(1) compara o modelo com o sinal original deslo- 
cado de um período de amostragem à frente. Em ambos os casos, valores 
menores do que a unidade indicam um melhor desempenho em relação ao 
preditor padrão considerado (média ou um passo à frente). Existem di- 
versos outros índices, como o somatório dos valores absolutos dos erros de 
predição ou como o índice (16.37), que será utilizado no estudo de caso da 
Seção 16.10. Uma boa comparação de vários índices pode ser encontrada 
em (FAIR, 1986). 


Exemplo 13.2.4. Ajuste a dados para validação 


Na Seção 16.7 serão apresentados dados obtidos de um paciente com 
apnéia durante o sono. Os detalhes da modelagem e análise desses sinais 
serão discutidos naquela seção. No presente exemplo, entretanto, deseja-se 
ilustrar como a simulação de modelos pode ser usada na sua validação. 

O conjunto de dados é composto de três séries temporais, a saber, 
oxigênio no sangue (BOS), respiração (R) e fregiência cardíaca (HR). Os 
modelos são multivariáveis do tipo MISO, sendo o sinal BOS a saída do 
modelo, e os sinais R e HR, as entradas. Tais modelos foram obtidos com o 
objetivo de caracterizar os sinais em condições respiratórias distintas, con- 
forme será discutido na Seção 16.7. 

A observação mais importante a ser feita aqui é que como o modelo 
requer os sinais de respiração e de fregiiência cardíaca como entrada, não é 
possível fazer predições propriamente ditas. O que pode ser feito, como é 
ilustrado na Figura 13.5, é, dados os sinais de entrada, determinar a saída 
do modelo por meio de simulação livre, ou seja, pode-se fazer a “predição” 
livre da variável de saída. 

Um fenômeno comum na simulação de modelos matemáticos pode ser 
observado na Figura 13.5b, mais especificamente durante o segundo ciclo 
do sinal mostrado. Em todos os gráficos, os primeiros valores dos sinais 
são utilizados como condições iniciais para inicializar os modelos. Após a 
inicialização, é comum observar-se um transiente numérico que é devido 
apenas ao modelo e não tem necessariamente nenhuma interpretação física. 
Um exemplo disso pode ser claramente observado durante o segundo ciclo 
no sinal da Figura 13.5b, após o qual o modelo segue o sinal medido com 
ótimo desempenho. A última observação sugere, portanto, que os modelos 
usados, apesar de não serem úteis para se fazer uma predição simultânea dos 


três sinais, representam bem as relações de causa e efeito entre as variáveis 
envolvidas. 
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x 10º 


FIGURA 13,5: Simulação do sinal de oxigênio usando modelos MISO 


Em todos os casos, os sinais de respiração e de fregiiência cardíaca 
usados, que são entradas, foram os sinais medidos. As janelas de 
dados mostradas não são as mesmas usadas na identificação dos 
modelos. (a) respiração normal, (b) apnéia, (c) apnéia intermiten- 
te, obtido usando modelo (16.27). (—) dados medidos, (——) saída 
dos modelos. O eixo horizontal é o número de amostras, e o eixo 
vertical é o sinal de oxigênio medido em intervalos de quantização. 


| 
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Antes de encerrar o presente exemplo, vale ressaltar que, a fim de se 
utilizar modelos matemáticos para se fazer predição propriamente dita, é 
necessário que os modelos sejam MIMO. Nesse caso, o modelo seria com- 
posto de três equações, uma para cada variável (BOS, R e HR), e o modelo 
pode ser usado de forma autônoma para fazer simulações livres, ou seja, 
predição. [a] 


13.2.1 Consistência de predição no espaço de estados 


O método a ser descrito nesta subseção foi proposto por McSharry e Smith 
(2004). Considere a Figura 13.6. 


(a) (b) 


F(B4s,)] 


FIBgS1)] 


FIGURA 13.6: Representação gráfica de simulação no espaço de estados 
Indicação de predições (a) consistentes, e (b) inconsistentes. Em 
(a) a região escura indica que há um subconjunto de predições que 
são indistinguíveis do estado “real” (x;41) ao se levar em conta a 
incerteza das observações. 


Chamemos a dinâmica “verdadeira” de G e um determinado modelo de 
F. O estado “verdadeiro” no instante i será indicado por x; e, portanto, o 
estado verdadeiro no instante i + 1 pode ser expresso como x;j1 = G(x;). 
Considera-se que o estado observado no instante i seja s;. A predição de 
um passo à frente do modelo F, a partir da última observação disponível, 
é 8; = F(s;). Por definição, o resíduo (erro de predição de um passo à 
frente) é €; = 8;,1 — F(s;). Além disso, considera-se que dim[x;] = dim[s;] 
e que s; está centrado em uma esfera de incerteza de observação de raio e, 
indicada por B.(s;). Considera-se que a distribuição da incerteza em B(s;) 
é uniforme, e que € é conhecido. 

Começando da esfera B.(s;), o modelo F é usado para iterar (propa- 
gar) B.(s;) um passo à frente. Na prática, um número finito de estados 
potenciais dentro de Be(s;) são gerados e subsegiientemente cada um deles 
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é propagado utilizando-se o modelo F, o que resulta em F[B(s;)]. No es- 
paço de estados, as taxas de convergência (e divergência local, no caso de 
modelos não-lineares) são diferentes, o que resulta na deformação de Be(s;). 
Assim, no caso de dinâmica linear F(B.(s;)] será um elipsóide, mas isso não 
é uma necessidade do método. Na Figura 13.6 F[B.(s;)] foi representada 
como um elipsóide por simplicidade apenas. 

A região no espaço de estados denominada F[B.(s;)] é a região mais 
provável de se encontrar o estado “verdadeiro” no instante à + 1 dados: o 
modelo F, a condição inicial observada s;, e o raio e da incerteza associada a 
essa observação. No instante i + 1 outra observação do estado, s;+1, torna- 
se disponível e considerando que e não mudou, Be(si+1) indica a provável 
região no espaço de estados onde o estado “verdadeiro” x;+1 estará. Portan- 
to, se a interseção entre F[B.(s;)] e Be(si+1) for não-nula, não há nenhuma 
razão de desqualificar a predição F(s;), dada a incerteza associada à obser- 
vação. Nesse caso, ilustrado na Figura 13.6a, diz-se que a predição F(s;) é 
dinamicamente consistente. O caso de predições inconsistentes é ilustrado 
na Figura 13.6b. 

É importante notar que o raio e da esfera de incerteza da observação 
é de fundamental importância. A fim de se obter resultados coerentes, é 
necessário ter uma estimativa confiável de e, caso contrário, qualquer modelo 
pode ser declarado consistente, bastando para isso aumentar € além do 
razoável. Na prática, estimativas para e poderão ser obtidas a partir da 
incerteza calculado por procedimentos de metrologia ou a partir do vetor de 
resíduos (por exemplo, seu desvio padrão) resultante da etapa de estimação 
de parâmetros. 


Exemplo 13.2.5. Consistência de previsões 2 


O presente exemplo considerará o oscilador de Duffing-Ueda investigado 
no Exemplo 12.2,2. A partir dos dados mostrados na Figura 12.6, quatro 
modelos foram obtidos, My, Ma, Ma e Ma (AguiRRE; BILLINGS, 1994). 
Este exemplo será considerado novamente ao longo deste capítulo. 

Aqui, procurou-se achar uma medida para a região cinza na Figura 13.6a. 
Procurou-se estimar B.(8;+1)NF(s;), em que F é o modelo em questão: Mi, 
Ma, M3 ou Mg. A fim de estimar essa grandeza, foi usada uma janela de 
validação de comprimento N = 250. Para cada um desses pontos, 300 va- 
lores uniformemente distribuídos dentro de uma hiperesfera centrada em si 
e com raio € foram propafados utilizando o modelo em questão. Portanto, 
para cada modelo 75.000 predições foram efetuadas. Neste exemplo, e foi 
tomado como duas vezes o desvio padrão da incerteza nos dados. Tal incer- 
teza, por sua vez, foi quantifica utilizando-se os resíduos de identificação e, 


2AGUIRRE et al., 1994. 
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neste exemplo, no qual não houve acréscimo de ruído, essa incerteza foi de 
aproximadamente 0,3% do desvio padrão dos dados. 

Os valores estimados usando os modelos Mi, Ma, M3 e Mg foram 
99,8%, 99,3%, 100% e 87%, respectivamente. À interpretação de 99,8% para 
Be(sm)N F(s;) é que 99,8% das realizações tomadas (dentro de Be(s;)), 
depois de iteradas uma vez com o modelo M1, estavam dentro de Be(s;,1), 
com e = 0,006. Essa medida diz respeito à capacidade de predição do 
modelo a curto prazo, mas como será visto ao longo do capítulo, tal índice 
não é muito discriminatório em termos de desempenho dinâmico. D 


13.3 Sincronização 


Como feito na Seção 13.2.1, voltaremos a falar em termos da dinâmica 
“verdadeira” G e de um determinado modelo F. Para fins de apresentação, 
faremos uso da seguinte representação em tempo contínuo 


E = G6) 
& = r(y)+Ek-y) (13.3) 


em que foi considerado que dim[x] = dim[y] e que E é uma matriz de 
acoplamento entre o sistema e o modelo, que denominamos de dissipativo. 

A idéia básica por trás do uso de sincronismo dissipativo para validar 
modelos foi originalmente proposta em (BROWN et al., 1994), e é como se 
segue. Considere que os dados x estejam sobre um atrator caótico.? Em 
muitos casos, se a matriz E for adequadamente escolhida e G=F, então y > 
x, ou seja, o modelo sincronizará com o sistema. De fato, em (LETELLIER 
et al., 2002a) isso foi testado variando-se um dos parâmetros de um modelo 
de tal forma a descobrir para que valor desse parâmetro o acoplamento de 
sincronismo era menor. 

Por outro lado, se houver pequenas diferenças entre G e F, o erro de 
sincronização e = y — x não tenderá a zero, mas será pequeno, sendo que 
a sua norma euclideana dependerá do erro de modelagem G(x) — F(x). 
Portanto, a norma do erro, que na prática é uma medida da qualidade do 
nível] de sincronização alcançada, é uma medida de quão distante está o 
modelo F da dinâmica original do sistema G, 

Para facilitar a implementação desse esquema, os autores sugeriram to- 
mar a matriz E em forma diagonal, com apenas um elemento diferente de 


?Isso não será necessário no uso do método para escolher modelos. 
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zero. Procedendo assim, os autores então comparavam |x — z| — em que 
z é o vetor de estado do modelo sem a ação externa — com |x — y|. Se 
|x — y] cair abaixo de um determinado limiar (10-2 foi usado por Brown 
e colegas em 1994); se essa diferença for “claramente” menor que |x — z|, 
ou seja, o acoplamento dissipativo está fazendo a sua parte, e se isso for 
tomado como indício de que o modelo está (ainda que aproximadamente) 
sincronizado com os dados, então F deve estar próximo de G. 

Apesar de interessante e simples, esse procedimento é muito subjetivo, 
pois requer que se defina um limiar ad hoc, a partir do qual será decidido se o 
modelo foi sincronizado aos dados. Um agravante, é que, em se tratando de 
acoplamento dissipativo, sabe-se que, em alguns casos, é possível melhorar 
o sincronismo aumentando-se o ganho (força de acoplamento) E. Às vezes, 
é possível alcançar algum grau de sincronização aumentando-se E, mesmo 
quando o modelo é falho. Portanto, é necessário complementar o método de 
sincronismo, para viabilizar seu uso no contexto de validação de modelos. 
Isso será brevemente descrito a seguir. 


13.3.1 Adaptação ao caso de tempo discreto 


Além de procurar contornar algumas das dificuldades do método original, 
decidiu-se adaptar o procedimento para o caso em que o modelo é de tempo 
discreto. Portanto, considera-se que os dados estão na forma séries tempo- 
rais z(k) (saída) e u(k) (entrada), para k = 1,2,...,N. Assume-se que os 
dados podem ser descritos por 


z(k) = 9(Wuz(k — 1), (13.4) 


em que Yuz(k — 1) é o vetor de regressores, e g é uma função desconhecida 
que relaciona todas as variáveis regressoras (independentes) em Yuz(k — 1) 
à saída futura z(k). 

Seja f um modelo qualquer obtido a partir dos dados disponíveis, tal 
que z(k) = f(Yuz(k — 1)) + E(k), em que a predição de um passo à frente 
do modelo é f(Wuz(k — 1)), e que E(k) é o resíduo. Não é necessário que as 
variáveis em Yuz(k — 1) e Yuz(k — 1) sejam as mesmas. 

Incialmente, deseja-se verificar se o modelo f sincronizará com os dados 
se f for acoplado a eles. Portanto, escreve-se 


v(k) = 9(buz(k = 1), 
( (6) = fbue(b — 1)) — h(k = 1), (188) 


em que A(k) = c (x(k) — 9(k)) e c E IR é uma constante. Nesse caso, o erro 
de sincronização de um passo à frente é definido como (FURTADO, 2003) 
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e(h) = a(8)-6(6) 
= o(Yue(6 = 1) = [Hua(k — 1)) = h(k = 1)] 
= c(v(k-1)-g(k-1))+ 
+ [ol babe = 1)) = fuel — 1] 
= ce(k-1)+E(k-1). (13.6) 


É instrutivo perceber que a Eq. 13.6 representa um modelo ARX. Por- 
tanto, o erro de sincronização de um passo à frente é um processo auto- 
regressivo de primeira ordem excitado pela variável “exógena” E(k — 1), 
sendo que para garantir que não haja divergência | c |< 1. Por um lado, 
a dinâmica auto-regressiva é governada pelo acoplamento dissipativo, por 
outro lado, o comportamento global é determinado pela função forçante 
E(k — 1), que é uma medida da distância entre a dinâmica do sistema ae 
produziu os dados g(Wbuz(k — 1)) e o modelo fuz(k = 1)). Se E(k—1) = 
então e(k) = 0, uma vez que | c |< 1. Assim, percebe-se que o erro o 
modelagem g(Wuz(k — 1)) — f(Wuz(k — 1)) é refletido em e(k). 

Um ponto muito curioso é observar que em (13.3) o acoplamento dissipa- 
tivo é uma realimentação negativa. Por outro lado, o acoplamento em (13.5) 
é uma realimentação positiva. A razão pela qual o modelo não diverge ao 
infinito é que a predição feita na segunda equação de (13.5) é de apenas um 
passo à frente 4 e, como visto na Seção 13.2, esse procedimento não permite 
ao modelo divergir o suficiente. Assim, essa realimentação positiva faz com 
que os erros de modelagem apareçam “amplificados” em e(k). Portanto, e(k) 
contém importante informação dinâmica, que será utilizada para avaliar a 
qualidade do modelo f, frente ao sistema 9. 


13.32 O custo de sincronização 


Pelo que foi apresentado aqui, é possível notar que o custo de sincronizar 
dois sistemas será proporcional à diferença dinâmica entre os dois. Essa 
observação serve de motivação para definir o seguinte índice de custo de 
sincronização; 


1 
Jemslc) = aim WWF à I(AIE, (13.7) 
=ho 


1A predição livre seria indicada por f(k) = f(Qua(k — 1)) = h(k — 1). 
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em que ko indica o instante em que o esquema de sincronização atinge 
estado estacionário. Interpretando h(k) = c(z(k) — 9(k)) como a ação de 
controle necessária para manter o modelo sincronizado aos dados, é possível 
interpretar Jrms(c) como a energia necessária para manter o modelo “perto” 
dos dados. Possivelmente, para conseguir que o modelo chege “ainda mais 
perto” é necessário gastar maior energia. Assim, não apenas é necessário 
quantificar o custo de sincronização, como também é necessário medir a 
qualidade da sincronização. Isso será feito a seguir. 


13.3.3 Classe de sincronização 


O quão sincronizado estará um determinado modelo aos dados será quan- 
tificado por um índice. Tal medida é uma adaptação do conceito de classe 
de sincronismo proposta por Tôrres (2001). 

Dois sistemas apresentam a condição de sincronismo quase-idêntico de 
classe e, a partir de um certo instante ko se e somente se (TÔRRES, 2001, 
TÔRRES; AGUIRRE, 2004) 


sup IJe(k)|| 
suplelmi+1 <e(c), Vk>ko (13.8) 
em que e(k) foi definido em (13.6), e a dependência com c foi evidenciada. 
Note-se que 0 < e(c) < 1. À condição e(c) = O implica z(k) = 9(k), para 
aquele valor específico de c. Por outro lado, e(c) = 1 indica comporta- 
mento assíncrono. Por questões práticas, dada uma segiiência de erros de 
sincronização e(k), será útil usar o máximo erro normalizado 


max [e(X:)] 


maciel rt = nl VkZho (13.9) 


13.3.4 Comparando modelos 


O procedimento a ser descrito nesta seção faz uso dos conceitos apresentados 
até este ponto, Em vez de tentar usar o presente procedimento para declarar 
um modelo válido, o mesmo será usado para comparar modelos. Portanto, 
o procedimento é útil para avaliar um conjunto de modelos e selecionar o 
que for dinamicamente melhor. 

A idéia principal é, dado dois modelos que tenham atingido a mes- 
ma classe de sincronismo quase-idêntico, ou seja, modelos que têm valores 
semelhantes de em(c), o modelo com o “melhor desempenho dinâmico”, ti- 
picamente será aquele para o qual o sincronismo pode ser estabelecido e 
mantido a um menor custo. 
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Deseja-se escolher entre dois modelos, M, e My, aquele cuja dinâmica 
é a mais parecida à dinâmica subjacente aos dados disponíveis. O procedi- 
mento pode ser sistematizado como se segue (AGUIRRE et al., 2006): 


1. determine, para cada modelo, o menor máximo erro normalizado de 
sincronização, ou seja, procura-se determinar el (cy )=minfel (c)] e 
&,(co)=minfe2, (c)], em que a minimização é efetuada para 0 < c < 1; 


2. seei(c;) < en(c;), os modelos podem ser classificados diretamente: a 
dinâmica de M; está mais próxima à dinâmica subjacente aos dados 
do que a dinâmica de M;. Senão, prossiga para o próximo passo; 


3. se eh(c1) = en (c), então determine os respectivos índices o custo 
Jhsc1) é Jns(c2). Se Jims(Ci) < Jims(C;), à dinâmica de M; está 
mais próxima à dinâmica subjacente aos dados do que a dinâmica 
de Mj. 


Portanto, o modelo que atingir o menor mázimo erro normalizado de 
sincronização com o menor custo é escolhido como o melhor modelo. 


Exemplo 13.3.1. Uso de sincronização para escolher modelos * 


Voltemos ao problema estudado no Exemplo 13.2.5. Os modelos consi- 
derados no presente exemplo são os mesmos e serão indicados por M1, Ma, 
Ms emas. 

A Figura 13.7 apresenta resultados do uso de sincronização para compa- 
rar o desempenho dinâmico dos modelos em questão.A Figura 13.7a mostra 
como o erro (de sincronização) máximo normalizado varia com c, e a Figu- 
ra 13.7b mostra o custo de atingir tal grau de sincronização. 

A partir da Figura 13,7a, pode ser visto que o menor erro mázimo nor- 
malizado do modelo Mg é eà(c3) = 3,6 x 1073, (ca nº 0,2), enquanto que 
para Mg tem-se ei (cg) = 3,2 x 1073, (cy = 0,6). Com respeito ao custo 
de sincronização, é interessante notar que, apesar de Jêns(C) = Jáns(C) para 
toda a faixa de valores de c, Jêns(c3) < Jáns(c4). No presente exemplo, 
My é melhor no sentido de que tal modelo atinge o melhor nível de sin- 
cronismo com os dados, comparado a todos os modelos investigados. Por 
outro lado, pode ser visto que para c = 0,5, o modelo My atinge o mesmo 
valor de erro máximo normalizado que o modelo My para c x 0,2, ou se- 
ja, en(0,2) = eh(0,5) = 3,6 x 1073, A análise prossegue verificando qual 
dos dois modelos atinge o mencionado nível de sincronismo ao menor custo. 
Pode ser verificado que J2,(0,2) < Jáns(0,5). Em outras palavras, My 
aa DO atoa di do 


SAGUIRRE et al., 2006. 
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FIGURA 13.7: Classe e esfoço de sincronismo 


Em (a) erro de sincronização máximo normalizado, definido na 
Eq. 13.9, (b) custo de sincronismo, definido na Eq. 13.7 para mo- 
delos do oscilador de Duffing-Ueda: (---) M1, (= -) M2, (=) Mg 
e (—, negrito) Ma. 


atinge um determinado nível de sincronismo a um menor custo, comparado 
com Ms, mas não há valores de c para o qual o melhor sincronismo de M3 
seja superior ao melhor sincronismo de M4. Uma regra prática é o mínimo 
erro mázimo normalizado que possa ser reconhecido “claramente” é o índice 
pelo qual se classificam os modelos. Portanto, no presente exemplo My é 
escolhido como melhor. 

Como será visto no Exemplo 13.6.1, de fato, o modelo Mg é dinamica- 
mente o melhor modelo. No Exemplo 13.6.1 isso será verificado de maneira 
bastante detalhada por meio do uso de diagramas de bifurcação. No presen- 
te exemplo, chegamos à mesma conclusão utilizando o conceito de sincroni- 
zação que, do ponto de vista computacional, demanda muito menos tempo. 
Além disso, ele não requer o conhecimento do diagrama de bifurcação do 
sistema original, para fins de comparação. [a] 


13.4 Análise de Resíduos 


Os testes de simulação descritos na seção anterior não indicam se as fa- 
lhas do modelo são corrigíveis. Por exemplo, ao comparar as predições 
com as observações, se houve erros significativos, não é possível afirmar se 
ocorreram devido a problemas na estimação de parâmetros ou se a diná- 
mica que produziu os dados não pode ser satisfatoriamente representada 
pelo modelo sendo validado. Na presente seção será brevemente discutido 
o procedimento de análise de resíduos. Como será visto, esse procedimento 
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informa se os parâmetros do modelo identificado foram ou não estimados 
corretamente. 

O ponto de partida é a definição do vetor de resíduos É = y — vô. No 
que diz respeito ao modelo, o vetor de resíduos depende dos parâmetros 
estimados, bem como dos regressores que compõem o modelo. Se o estima- 
dor usado for baseado no estimador MQ, então sabe-se (ver Capítulo 5) que 
a soma do quadrado dos resíduos é mínima para o vetor de regressores esco- 
lhido. Assim sendo, a variância dos resíduos não é um indicador adequado 
para validar modelos dinâmicos. 

Por outro lado, deve-se lembrar de que uma das principais condições 
requeridas para que o estimador MQ não apresentasse polarização (ou ten- 
dência) na determinação de Ô era que o erro na equação de regressão deveria 
ser ruído branco. Como o modelo identificado y(k) = Tô + E(k) é obti- 
do diretamente da equação de regressão após a estimação dos parâmetros, 
torna-se claro que para se ter E[ôMq]=8 é necessário que os resíduos sejam 
brancos. Portanto, análise de resíduos designa um conjunto de testes que 
são efetuados para verificar se os resíduos são aleatórios ou não. 

No Capítulo 6 foi mostrado que, a menos que o erro na equação de regres- 
são seja completamente aleatório (branco), o estimador MQ será polarizado 
ou tendencioso. Do ponto de vista da validação de modelos, a motivação de 
se verificar quão aleatórios são os resíduos pode ser entendida lembrando-se 
que os resíduos são a parte dos dados que o modelo não conseguiu expli- 
car. Exigir que o modelo explique os dados em todos os seus detalhes é, no 
mínimo, ingênuo. Mas quanto dos dados precisa ser explicado? O modelo 
deve explicar tudo que for ezplicável nos dados. Se isso ocorrer, então os 
resíduos conterão apenas aquilo que não é explicável e, consequentemente, 
serão brancos. Portanto, se ao testar o vetor de resíduos for verificado que se 
trata de uma variável aleatória branca, isso significa que não há informação 
útil nos resíduos, ou seja, o modelo explicou tudo que era possível explicar. 
Infelizmente, isso não quer dizer que a simulação livre do modelo será boa, 
mas simplesmente que a simulação de um passo à frente do modelo será 
boa, 

Por outro lado, se os resíduos não forem brancos, haverá informação 
neles indicando que o modelo não conseguiu explicar tudo que era explicável 
nos dados. Nessa situação, conforme visto no Capítulo 6, o estimador MQ 
está polarizado. Pode-se tentar contornar o problema escolhendo-se um 
novo conjunto de regressores e estimando-se os parâmetros novamente. Se 
os novos regressores forem mais adequados para explicar os dados, o novo 
vetor de resíduos será mais aleatório. 

Conforme visto no Capítulo 4, um vetor de valores E(k) é linearmente 
branco se a sua função de autocorrelação for nula para todos os valores 
de atraso maiores ou iguais a um, ou seja, ree(k) = 0, Vk £ O. Portan- 
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to, seu espectro de densidade espectral de potência é constante, ou seja, 
todas as fregiiências estão igualmente representadas na variável, mas não 
necessariamente em uma particular realização de tal variável. Para efeito de 
exposição, entretanto, o termo linearmente branco será usado para indicar 
situações em que não há autocorrelação (linear) no vetor considerado. 

Ao testar a aleatoriedade de um vetor de resíduos, deve-se ter em men- 
te que tal vetor é o resultado do ajuste de uma estrutura matemática (os 
regressores do modelo) a um determinado conjunto de dados. Nesse con- 
texto, considere o caso em que o vetor de resíduos seja linearmente não 
autocorrelacionado, ou seja, suponha que É seja tal que reg(k) = 0, Vk £ 0. 
Nesse caso seria natural perguntar quão geral é o resultado. Será que o 
modelo teria um desempenho semelhante para outros conjuntos de dados? 
Uma forma de verificar quão particular é o resultado é calcular a função 
de correlação cruzada entre o vetor de resíduos e o sinal de entrada u(k), 
ou seja, rus(k). Nesse caso, se rug(k) = 0, Vk, tem-se que o vetor de erros 
cometidos pelo modelo não depende do sinal de entrada usado para obter 
o modelo. A implicação desse resultado é que as predições de um passo à 
frente do modelo terão características semelhantes se calculadas para um 
outro conjunto de dados. 

No caso de dados observados de sistemas não-lineares, é concebível que 
um modelo linear consiga explicar toda a informação linear nos dados. Se 
for esse o caso, os resíduos de tal modelo, em princípio, passarão pelos dois 
testes mencionados acima. Entretanto, é de se esperar que no vetor de 
resíduos haja correlações não-lineares. A fim de detectar tais correlações, 
funções não-lincares devem ser utilizadas. Um conjunto de funções usadas 
na validação de modelos identificados não-lineares é mostrado a seguir: é 


reelr) = Elé(k = )é(K)) = 67), 

rug(T) E(u(k — T)E(k)) = 0, Yr 
rever) = El(u(k = 1) 126) = 0, Vr, (13.10) 
rel) = Edu 1) = UBE) =0, Vr, 
regulr) = Ele(b)Ek=1=m)ulk=1-7)) = 0,720, 


sendo que 6(0) é o impulso unitário e a barra indica o valor médio, No 
conjunto de equações (13.10), as duas primeiras equações são as conhecidas 
funções de autocorrelação e correlação cruzada (lineares), ao passo que as 
demais relações são não-lineares. Evidentemente, poderá haver nos residuos 
dependências não detectáveis por (13.10) e, nesse caso, funções específicas | 
| 


*BiLincs; Voon, 1986. À 
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poderão ser derivadas. De fato, novos conjuntos de funções têm sido pro- 
postos para a validação de modelos não-lineares (BILLINGS; ZHU, 1995). 

Se o modelo identificado não tiver entrada, ou seja, for do tipo AR(MA) 
ou NAR(MA), pode-se usar o seguinte conjunto de funções para se avaliar 
a aleatoriedade dos resíduos: 7 


reelr) = EL(E(h) — EM)E(E — 7) — EM) = dr), 
reelt) = E((E(k) — EK) (Elk — 7) — E(R))?) = 0, (13.11) 
rerelr) = EMO) — EM) (EK — 7) — ER) = 67). 


Deve ser notado que, ao contrário dos testes descritos na seção anterior, 
a análise de resíduos considera o desempenho do modelo no conjunto de 
dados de identificação, uma vez que os resíduos são definidos como o erro 
do preditor de um passo à frente nos dados utilizados pelo estimador MQ e 
são subproduto do procedimento de estimação de parâmetros. 


Exemplo 13.4.1. Análise de resíduos de modelos de erro na saída e ARX 


O Exemplo 6.3.4 é aqui reconsiderado. Dois modelos, um ARX e um 
outro do tipo erro na saída, foram estimados a partir de um conjunto de 
dados, sendo que o ruído adicionado em ambos os casos era branco. Confor- 
me demonstrado no Capítulo 6, sabe-se que o estimador MQ não resultará 
em polarização ao estimar os parâmetros do modelo ARX, ao passo que 
haverá polarização ao estimar os parâmetros do modelo de erro na saída. A 
Figura 6.2 claramente ilustra que esse é o caso de fato. Mas num problema 
prático, os valores “reais” dos parâmetros dos modelos não são conhecidos, 
nem a forma com que o erro deve ser incorporado ao modelo. Em situações 
reais o que se tem é um (ou mais) conjunto de dados e um modelo estimado, 
sendo que para isso algumas escolhas ad hoc foram feitas pelo modelador. 
Será que é possível saber se o estimador está polarizado? A resposta a essa 
questão é afirmativa, e a forma de se fazer essa avaliação, obviamente, não 
é produzindo histogramas como aqueles mostrados na Figura 6.2, mas por 
meio da análise de resíduos. 

Para apreciar isso, considere a Figura 13.8. Claramente, percebe-se que 
os resíduos do modelo de erro na saída não são brancos, ao contrário dos 
resíduos do modelo ARX (ver Exercício 13.5). Isso indica, sem dúvida, 
que o estimador usado para obter os parâmetros do modelo de erro na saída 
está polarizado. Além disso, o fato de apenas reg(T) estar significativamente 
fora dos limites de confiança (de 95%) sugere que o problema é a forma com 


"BiLLiNGs; TAO, 1991. 
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FIGURA 13.8: Análise de resíduos de modelos de erro na saída e ARX 


Análise de resíduos de modelos de erro na saída e ARX. Os gráficos 
(a) e (b) referem-se ao modelo de erro na saída e os gráficos (c) e 
(d) referem-se ao modelo ARX. (a) e (c) são reg(), (b) e (d) são 
rug(r). 


que o ruído foi tratado no modelo e não que o problema tenha sido uma 
especificação equivocada da estrutura do modelo. Portanto, a Figura 13.8 
está de pleno acordo com a Figura 6.2 do Exemplo 6.3.4, e percebe-se como 
a análise de resíduos pode ser, de fato, útil em problemas reais para avaliar 
o desempenho do estimador. Como mencionado anteriormente, o fato de 
os resíduos serem aleatórios não garante o bom desempenho do modelo em 
termo de predições, [n 


Exemplo 13,4,2, Análise de resíduos de modelo de série de preço 


No presente exemplo serão usados os dados de economia descritos na 
Seção 16.10, A esses dados foi ajustado um modelo linear, A análise de 
resíduos de tal modelo é mostrada na Figura 13.9. Note que, em se tratando 
de apenas uma série temporal (sistema autônomo), o conjunto de funções 
utilizado na validação é (13.11). 


A Figura 13.9 claramente indica que, apesar de não haver correlação 
(linear) nos resíduos (o modelo linear explicou essa informação nos dados), 


á 
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(a) (b) 


o 5 10 
atraso 


FIGURA 13.9: Análise de resíduos de modelo de série de preço 


Funções dos resíduos de um modelo linear ajustado a uma série 
temporal de preços, ver Seção 16.10. (a) ree(T), (b) rega(7) e 
(c) rezgx' (7), ver equação (13.11). 


esses não são brancos, uma vez que há dependência não-linear nos resíduos. 
Nesse caso, o modelo linear é inadequado e modelos não-lineares devem ser 
utilizados, conforme discutido na Seção 16.10. [m] 


No caso de modelos multivariáveis, cada equação do modelo tem o seu 
resíduo. Nesse caso, é fundamental que tais resíduos sejam aleatórios e 
independentes entre si. A fim de testar essa condição, um grande número de 
funções foram definidas em (BILLINGS et al., 1989), semelhantes à Eq. 13.10, 
em que várias combinações entre os vetores de resíduo e variáveis do modelo 
são testadas, 

Finalmente, deve ser dito que a análise de resíduos é importante, na 
medida em que revela se o modelo escolhido está fazendo o que se espera 
dele apenas no que diz respeito ao seu ajuste aos dados de identificação. 
Infelizmente, tal análise não garante a qualidade nem a utilidade de um 
modelo. Por exemplo, é comum obter modelos cujos resíduos são brancos, 
mas cujas predições livres são insatisfatórias. Em outras palavras, tais 
modelos têm boas predições de um passo à frente, mas suas predições de 
infinitos passos à frente (predições livres) não são boas. Analogamente, 
o contrário às vezes ocorre. Modelos cujos resíduos não são totalmente 
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brancos representam bem a dinâmica do sistema sendo estudado. Isso serve 
de lembrete de que na validação de modelos mais de um indicador deve ser 
utilizado. 


13.5 Validação para Aplicações em Malha Fechada 


Na introdução deste capítulo foi visto que a validação de modelos deve pre- 
ferencialmente levar em conta o uso pretendido para o modelo. A presente 
seção considera especificamente o caso de modelos que serão utilizados para 
aplicações em malha fechada, tais como o projeto ou sintonia de controla- 
dores e a simulação de malhas de controle. 

A idéia central na presente seção é simples e é motivada pela seguinte 
questão: em que difere a validação de um modelo cujo uso pretendido é 
aplicações em malha fechada? Como será visto, um modelo pode ter um 
bom desempenho em malha aberta, mas ser inaceitável em malha fechada. 

A discussão será feita no contexto de exemplos numéricos a fim de ilus- 
trar os pontos básicos. Nos exemplos, em vez de sistema real e mode- 
los identificados, serão usados modelos originais (representando os sistemas 
reais) e modelos reduzidos ou aproximados (representando os modelos iden- 
tificados). Deve-se notar que o fato de os modelos validados na presente 
seção não terem sido obtidos por métodos de identificação? em nada afeta 
o procedimento de validação sugerido. 


Exemplo 13.5.1. Validação em malha aberta versus malha fechada 


No presente exemplo serão considerados os seguintes modelos: 


145º + 2485? + 900s + 1200 


sinto ONE O, 13.12 
HS) = rp 185 + IQDsT + 180s + 120" (aa) 
11,9827s + 12,5318 
H se 13.13 
PO = 74 210835 + 12590' (119) 
16,4360s + 88,7840 
Ep AO A 13.14 
Hx(o) = 4 0,4750s + GATA day 


A Figura 13.10a mostra as respostas ao degrau das funções de transfe- 
rência H(s), Hp(s) e Hx(s). 


8De fato, os modelos aqui usados foram derivados no contexto de aproximação e 
redução da ordem de modelos, assunto a ser brevemente abordado na Seção 14.3. 
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FiGura 13.10: Validação em malha aberta e fechada 


Respostas ao degrau de (—) H(s), (--) Hp(s) e (-—) Hx(s), 
(a) em malha aberta, e (b) em malha fechada com o controlador 
C(s)=2/s. 


Não há dúvida de que tais respostas são muito semelhantes. Para quan- 
tificar os desvios entre os modelos, H(s) será considerada a “planta”, sendo 
que as funções de transferência Hp(s) e Hx(s) são aproximações de H(s). 
O somatório dos erros, entre a resposta ao degrau da “planta” e dos modelos 
aproximados, ao quadrado, é 5,00 quando o modelo aproximado é Hp(s) e 
41,54 quando se usa Hx(s). Uma análise mais detalhada da Figura 13.10a 
revela que, de fato, a resposta ao degrau de Hp(s) está mais próxima da 
resposta ao degrau da “planta” do que a resposta de Hx(s). 

A Figura 13,10b, por outro lado, mostra as respostas ao degrau das 
funções de transferência H(s), Hp(s) e Hx(s) em malha fechada com o 
controlador C(s) = 2/s e realimentação unitária, Com relação a essa figura, 
duas observações importantes precisam ser feitas. Em primeiro lugar, ao 
fechar a malha as respostas dos modelos em questão não são tão parecidas 
entre si como o eram a suas respostas em malha aberta. Em segundo lugar, 
a melhor aproximação em malha aberta é a pior em malha fechada. Isso 
pode ser quantificado pela soma do quadrado dos erros das respostas em 
malha fechada, que são 8,38 para Hp(s) e 0,19 para Hx(s). Esse simples 
fato revela que se o uso pretendido para um determinado modelo for em 
aplicações em malha fechada, validá-lo em malha aberta poderá conduzir a 
resultados incorretos. 
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Uma outra forma de ver o problema é a partir das respostas em frequência 
mostradas na Pigura 13.11. 


1CQm)HGo) (dB) 


faso (graus) 


o(radis) 


FIGURA 13.11: Validação no domínio da frequência 


Respostas em fregiiência de (—) 2H(juw)/jw, (---) 2Hp(jw) /jta e 
(==) 2Hx(jw)/ju. 


As respostas em fregiiência das funções de transferência em malha aberta, 
mostradas na Figura 13.11, revelam que a qualidade da aproximação dos 
modelos Hp(s) e Hx(s) depende da faixa de fregiiência (ver Exercício 13.6). 

Uma dificuldade prática, obviamente, é que a menos que se conheçam, a 
priori, (ou seja possível estimar) as margens de ganho e fase, torna-se muito 
difícil usar essa informação na validação de modelos. a 


13.6 Complementos 


Complemento 13,1, Validação de Modelos com Dinâmica Caótica 


Na Seção 13.2 foram apresentados índices que quantificam o desempenho 
de modelos do ponto de vista de predições. A premissa básica para esse 
procedimento é que se a dinâmica do modelo for suficientemente próxima 
à do sistema, as predições convergirão, ainda que aproximadamente, aos 
dados medidos do sistema real. 
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Há uma classe de sistemas, entretanto, em que tal premissa não se aplica. 
Trata-se de sistemas que são sensíveis às condições iniciais. Essa proprieda- 
de determina que, mesmo em casos de desvios infinitesimais nas condições 
iniciais ou nos parâmetros, haverá divergência entre as soluções do modelo 
(simulação) e os dados com os quais se deseja comparar a simulação do mo- 
delo. Sistemas que exibem dinâmica caótica são, por definição, sensíveis às 
condições iniciais. Conseqiientemente, a comparação no domínio do tempo 
de simulações do modelo com os dados medidos não serve como critério para 
validar o respectivo modelo. 


O objetivo da presente seção é descrever brevemente procedimentos que 
podem ser utilizados na validação de tais sistemas. Alguns desses procedi- 
mentos serão ilustrados na Seção 16.2 na validação de um oscilador caótico. 
Como será visto, tais técnicas têm vantagens e também desvantagens em 
certas situações reais. Para maiores detalhes de como obter os invariantes 
dinâmicos usados para a validação, o leitor pode consultar as referências 
sugeridas ao fim do capítulo, bem como livros básicos sobre dinâmica não- 
linear (FIEDLER-FERRARA; PRADO, 1994, MONTEIRO, 2006). 


Na validação de sistemas dinâmicos não-lineares com dinâmica caóti- 
ca, o fundamental é encontrar características fundamentais de tais sistemas 
que possam ser utilizados para validar os modelos obtidos. Por essa breve 
discussão, percebe-se que a predição temporal usando modelos com dinà- 
mica caótica não caracteriza tais modelos, uma vez que uma infinitésima 
perturbação nas condições iniciais ou nos parâmetros do modelo resulta em 
predições temporais completamente distintas. Neste ponto, sugere-se que o 
Jeitor consulte a Figura 16.6, em que são mostradas as formas de onda da 
tensão elétrica de um oscilador com dinâmica caótica e a respectiva simu- 
lação obtida usando-se um modelo que foi julgado válido. A comparação 
visual das formas de onda é dificultada, uma vez que, devido à sensibilidade 
a condições iniciais, não existe uma correspondência ponto a ponto entre os 
sinais. 


Uma forma de contornar essa dificuldade é trabalhar num espaço onde 
O tempo não seja explicitamente representado. Esse problema é conhecido 
como a reconstrução do espaço de estados. Considere a seguinte segiiência 
temporal de valores de um sistema ou modelo y(k), k = 1,2,... Eviden- 
temente tal segiiência de números pode ser representada num gráfico onde 
os valores são indicados com relação ao índice k, como foi feito na Figu- 
ra 16.6 mencionada anteriormente. Nesse caso, o que se tem é a própria 
série temporal. Mas se forem tomados conjuntos subsegiientes de de valores 
da mesma segiiência de forma a se ter 
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Yell) = [y(1) (2) ... v(de)J”, 
vel?) = [y(2) v(3) ... ulde + 1)", 


Yel3) = [u(3) ua) ... ulde + 2)", 


então a segiiência de vetores de dimensão de, ye(1), Ye(2), Ye(3)... po- 
de ser representada como uma segiiência de pontos no espaço Rº. Tal 
seqiiência é referida como sendo uma trajetória do sistema, ou do modelo, 
imersa no espaço de estados. Nesse contexto o espaço é chamado de espaço 
de imersão. A importante observação a ser feita é que se duas segiiên- 
cias temporais forem produzidas pelo mesmo sistema, nas mesmas condi- 
ções, ainda que o sistema apresente dinâmica caótica, ou seja, ainda que as 
duas segiiências temporais sejam “totalmente distintas” no tempo, ao serem 
imersas no espaço de estados ambas as trajetórias estarão sob o mesmo ob- 
jeto, normalmente referido como atrator. Isso pode ser visto comparando-se 
as Figuras 16.2 e 16.4, que são resultado da imersão das séries temporais 
mostradas na Figura 16.6. À maioria dos atratores no espaço de estados 
são robustos a perturbações infinitesimais nas condições iniciais e nos pa- 
râmetros e, portanto, se prestam para aplicações de validação. Então, em 
vez de se compararem séries temporais, na validação de sistemas caóticos, é 
mais adequado compararem-se, por exemplo, seus atratores, como ilustrado 
na Seção 16.2. 

Com respeito a isso, há vários aspectos dos atratores que podem ser 
comparados. Por exemplo, projeções bidimencionais de atratores podem 
ser comparadas, Outras características que podem ser comparadas ao se 
validar modelos com dinâmica caótica são cortes dos atratores (seções de 
Poincaré), ou mesmo a segiência de atratores obtidos à medida que se 
varia um parâmetro do modelo (diagramas de bifurcação). Vários desses 
procedimentos foram comparados em (AGUIRRE; BILLINGS, 1994) e, os 
resultados referentes aos diagramas de bifurcação são ilustrados no próximo 
exemplo. 


Exemplo 13.6,1, Uso de diagramas de bifurcação ? 


O presente exemplo considerará o oscilador de Duffing-Ueda investigado 
no Exemplo 12,2.2, A partir dos dados mostrados na Figura 12.6, quatro 
modelos foram obtidos, M1, Ma, Mg e Ma. O diagrama de bifurcação do 


“Aguirre; BILLINGS, 1994. 
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oscilador original pode ser visto na Figura 12.3. Alguns índices comumente 
utilizados, inclusive aqueles calculados no Exemplo 13.2.5, são mostrados 
na Tabela 13.1. 


TABELA 13.1: Maior expoente de Lyapunov (A) e dimensão de correlação (Dc) 
para os atratores obtidos com u(t) = 11 cos(t) e os modelos Mi, Ma, Ms e Ma. 
A última coluna mostra a probabilidade média de que as predições de um passo 
à frente sejam dinamicamente consistentes para € = 0,006 (ver Exemplo 13.2.5). 
Entre parênteses são fornecidos os valores mínimo e máximo. 


modelo | À D. Be(s;1) NF(s;) 
original = 

[0,09 | 2,315 0,001 | 99,87%(92-100) 
[0,09 | 2,244x 1077 | 99,3%(63-100) 
1007%(99-100) 
87%(29-100) 


FONTE: (AGUIRRE; FURTADO; TÔRRES, 2006). 


Tomando como base os resultados da Tabela 13.1, é difícil classificar os 
modelos. Ao que tudo indica, o modelo M2 é um pouco inferior aos demais, 
especialmente em termos do índice De. Além disso, parece que as predições 
de um passo à frente de M, são um pouco menos consistentes. 

Os diagramas de bifurcação desses modelos são mostrados na Figu- 
ra 13.12. Tomando por base tais diagramas, o modelo M4 é o melhor. 
Seria difícil chegar a essa classificação a partir da Tabela 13.1, o que garan- 
te aos diagramas de bifurcação grande sensibilidade a erros de modelagem. 
Infelizmente, a obtenção desses diagramas é computacionalmente pesada. O 
método baseado em sincronização, descrito na Seção 13.3, goza de muitos 
dos benefícios dos diagramas de bifurcação, quanto à sensibilidade a erros 
de modelagem, e tem baixo custo computacional. [m| 


Leitura Recomendada 


Surpreendentemente, há poucos trabalhos publicados que tratam exclusiva e 
detalhadamente do problema de validação de modelos. O que normalmente 
acontece é que a informação sobre técnicas de validação aparece como par- 
te dos trabalhos de modelagem matemática e identificação de sistemas. 
Billings e Voon (1983 e 1986) foram, aparentemente, os primeiros a sugerir o 
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(a) (b) 


FIGURA 13.12: Diagramas de bifurcação do oscilador de Duffing-Ueda 


Entrada u(t) = Acos(t) e 4,5 < A < 12 para: (a) My, (b) Ma, 
(c) Ms, (d) Ma. Compare com o diagrama da Figura 12.3. 


uso de funções não-lineares para se fazer o teste de resíduos. Posteriormen- 
te, novos grupos de tais funções foram propostos (BILLINGS; ZHU, 1995). 
Uma boa comparação sobre o uso de diversos tipos de predições para valida- 
ção de modelos, no contexto de modelagem de processos de economia, pode 
ser encontrada em (FAIR, 1986). Um grande número de critérios de infor- 
mação foram discutidos no contexto de validação de modelos em (STOICA 
et al. 1986; LEONTARITIS; BILLING, 1987). Alguns aspectos práticos da 
validação de modelos foi abordada em (MENDES, 2007). 


O uso de ferramentas como seções de Poincaré, mapas de primeiro re- 
torno e diagramas de bifurcação nem sempre são fáceis de se obter para o 
sistema real. Em casos onde séries temporais relativamente longas estão 
disponíveis, seções de Poincaré e mapas de primeiro retorno podem ser 
facilmente obtidos para o sistema sendo identificado. Por outro lado, a me- 
dição de diagramas de bifurcação requer procedimentos experimentais mais 
elaborados. Em (MOLTENO; TUFILLARO, 1990; HAMILL et al., 1992) são 
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mostrados exemplos da medição de diagramas de bifurcação. Uma alterna- 
tiva, entretanto, parece ser a estimação de diagramas de bifurcação a partir 
de dados experimentais, mas tais procedimentos ainda estão em desenvol- 
vimento e precisam amadurecer (HENRIQUE et al., 1998; BAGARINAO et 
al., 1999). O uso de tais ferramentas é muito útil na validação de modelos 
de sistemas dinâmicos não-lineares. Em particular, obter um modelo que 
aproxime o diagrama de bifurcação do sistema original é uma tarefa difí- 
cil (AGUIRRE; BILLINGS, 1994; AGUIRRE; MENDES, 1996; CORRÊA et al., 
1998). 

O uso de ferramentas de análise topológica de atratores é muito pode- 
rosa na validação de modelos em situações reais (LETELLIER et al., 1995; 
LETELLIER et al., 1996; LETELLIER, 2006). Entretanto, tal procedimento 
parece esbarrar em duas dificuldades. Primeiramente, os conceitos e ferra- 
mentas requeridos para se fazer tal análise não são, em geral, comuns às 
pessoas envolvidas com desenvolvimento de modelos matemáticos a partir 
de dados. Em segundo lugar, as técnicas de análise topológica estão limi- 
tadas a aplicações em que os modelos são de ordem 3 ou menor. Foge ao 
escopo deste livro abordar com detalhes as ferramentas mencionadas acima 
e no complemento. Recomenda-se a leitura de (ABARBANEL et al., 1993; 
GILMORE, 1998; AGUIRRE, 1996a,b) como introduções ao assunto, bem 
como para longas listas de referências. Atualmente, vários livros sobre o 
assunto estão disponíveis. Menciona-se aqui (FIEDLER-FERRARA; PRADO, 
1994; MONTEIRO, 2006; LETELLIER, 2006; PIQUEIRA, 2007), livros em por- 
tuguês, e o livro de Parker e Chua (1992), claramente dedicado ao problema 
de como calcular invariantes dinâmicos. Uma lista de referências que inclui 
esse assunto pode ser encontrada em http://www. cpdee .ufmg.br/"MACSIN. 

O uso de características estáticas de modelos não-lineares na sua 
validação não é, até o presente, procedimento comum. Uma maneira de 
fazer isso é avaliando-se funções que medem o desvio entre a função estáti- 
ca de modelos e valores em estado estacionário obtidos para o sistema em 
estudo. No caso de modelos polinomiais, uma expressão analítica para esse 
desvio é a Eg. 10,81, 

Na área de modelagem de sistemas de sistemas químicos (principalmente 
pH), é importante que o modelo consiga reproduzir a característica estáti- 
ca não-linear do sistema (HERNÁNDEZ; ARKUN, 1993; POTTMANN et al., 
1993). Verificar se o modelo identificado reproduz ou não a característica 
estática não-linear do sistema é importante e simples de se realizar na prá- 
tica em muitas áreas do conhecimento. Corrêa (2001) propôs um algoritmo 
que avalia a localização e estabilidade de autovalores de matrizes jacobia- 
nas de modelos não-lineares como forma de validação. Foi mostrado que 
tal algoritmo é capaz de detectar certas dificuldades em modelos que pas- 
sam em outros testes de validação, tais como o uso de índices estatísticos e 
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dinâmicos (CORRÊA, 2001). Semelhantemente, utilizando a função de au- 
tovalores abordada no Complemento 10.6, modelos de vazão de rio foram 
validados (ALVES et al., 2002) 


Exercícios 


13.1. Observando os últimos 150 minutos da simulação mostrada na Figu- 
ra 13.2a, parece que o modelo em questão é adequado. Explique a razão da 
divergência observada no período logo após a inicialização do modelo, ou 
seja, aproximadamente de 75 a 120 minutos. 


13.2. Explique a motivação fundamental do uso do conceito de sincronismo 
na avaliação do desempenho dinâmico de modelos, 


13.3. Discuta qual é a motivação para o uso de funções de correlação na 
análise de resíduos de modelos identificados. Essa motivação ainda é justi- 
ficável na análise de resíduos de modelos cujos parâmetros foram estimados 
pelo estimador VI? Justifique. 


13.4. Discorra sobre a seguinte afirmativa verdadeira: a análise de resíduos 
deve ser realizada utilizando-se resíduos referentes à janela de identificação, 
e não a uma janela de validação. 


13.5. Na Figura 13.8b observa-se que a função de correlação cruzada entre 
o vetor de resíduos e a entrada não é nula para atraso nulo. Essa observa- 
ção parece contradizer a propriedade de ortogonalidade do estimador MQ, 
descrita na Seção 5.4.2, Argumente no sentido de mostrar que a proprieda- 
de de ortogonalidade permanece válida, mesmo no Exemplo 13.4.1. Dica: 
observe a estrutura do modelo utilizado no Exemplo 6.3.4, e indique quais 
são os regressores aos quais o vetor de resíduos é feito ortogonal. 


13.6. Explique a razão de o modelo Hp(s), no Exemplo 13.5.1, ser uma 
melhor aproximação a H(s) do que Hx(s), para a resposta ao degrau em 
malha aberta, e ter uma resposta ao degrau em malha fechada que é pior 
do que a de Hx(s) com o mesmo controlador. Em função de sua resposta, 
sugira um procedimento, no domínio da frequência, para a validação de 
modelos cujo uso pretendido seja aplicações em malha fechada. 
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Capítulo 14 


Tópicos Especiais em 
Modelagem e Identificação 


14.1 Introdução 


Este capítulo trata de alguns aspectos específicos relacionados à modelagem 
matemática de sistemas dinâmicos. Primeiramente, na Seção 14.2, será tra- 
tado o assunto de dominância modal. Em poucas palavras, deseja-se saber, 
dado um modelo, quais são os seus modos dominantes. Uma maneira sim- 
plísta de abordar o problema é verificar a posição dos pólos no plano s. Os 
pólos mais lentos são normalmente considerados dominantes. Infelizmente, 
esse critério nem sempre é válido e para contornar alguns desses problemas 
definem-se os índices de dominância modal. 

A Seção 14.3 pode ser vista como uma breve introdução tutorial ao 
problema de aproximação de modelos pelo método de Padé e seus derivados. 
Tais métodos são úteis não apenas em problemas em que se deseja obter um 
modelo que se aproxime de um outro, mas também podem ser utilizados em 
problemas de compensação dinâmica, O capítulo inclui alguns exemplos e, 
ao final, recomenda-se literatura específica para o leitor interessado. 


14.2 Dominância Modal 


Em muitas situações deseja-se verificar se um modelo tem modos dominan- 
tes e, em caso afirmativo, ser capaz de determiná-los, No caso de redução de 
ordem de modelos, a retensão dos modos dominantes normalmente permite 
obter modelos simplificados mais precisos. 

Um procedimento comumente utilizado é reter os modos com as maiores 
constantes de tempo, ou seja, aqueles com pólos mais próximos do eixo 
jw. Apesar de normalmente produzir bons resultados, esse procedimento 
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apresenta os seguintes problemas: i) os modos mais lentos podem não ser os 
mais dominantes, ii) alguns modelos, apesar de ter modos dominantes, têm 
pólos que estão confinados a uma região pequena no plano s, o que dificulta 
a escolha baseada no critério de distância ao eixo imaginário, iii) no caso de 
pólos complexos conjugados a decisão nem sempre é fácil. 

A seguir serão definidos índices que podem ser usados para quantificar 
a dominância modal. Apesar de bastante simples, esses índices são normal- 
mente efetivos em determinar os modos dominantes em modelos. Além de 
levar em consideração as constantes de tempo de cada modo (informação 
contida nos pólos), os índices de dominância modal (IDM) também usam 
informação sobre a localização dos zeros da função de transferência. 


14.2.1 Índices de Dominância Modal 


Funções de transferência 


Seja a função de transferência 


bo+bys +... +bys” 


Ah ese MESA 


(1441) 


Pressupõe-se que G(s) não tenha pólos com multiciplidade maior que 
um, en <r. Logo, G(s) pode ser escrita da seguinte forma: 


A Jk Jem 
G >>D— + +t—— +—— 
om EE SA 
Jim Jkta E 
+ ppt pt (14.2) 
(8 — Aka) (s— Asa) (s— a) 
ou 
Qt Er pi e ai 
(s =) (s — A) 


pm + Jkri)s — (Je + Ji) a 
(s — Apis — A) 

(Jesa + Jess = (JetaAkra + Jisghk+a) (14.3) 
(s — Arg)(s — Arg) i 

sendo que J; é o i-ésimo resíduo correspondendo ao pólo A;, os asteriscos 
indicam conjugados complexos, k é o número de pólos reais e q é o número de 
pares conjugados, portanto, k+2q=n. Assume-se também que Re(A;) <O Vi. 
Em situações reais, a consideração de que G(s) não tem pólos repetidos 
fora da origem do plano s não é restritiva. No caso (teórico) de funções de 
transferência com pólos repetidos é possível substituir tais pólos por outros 
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com pequenas diferenças. Deve ser notado que os IDM não são definidos 
para modos com pólos tais que Re(A;) > 0. Isso não é crítico, uma vez que, 
em certo sentido, tais modos são sempre dominantes. 

O iésimo IDM é (ver mdi 0) 


n%= 2 i=12,...,k; (14.4) 
; 
a Ur Tede) RETA) (145) 
) MARA MM : 


Pi = RAU-Lk+AMUI=I2.. q 


Pólos complexos conjugados têm índices de dominância modal idênticos 
na Eq. 14.5, ou seja, Y+21-1 = Yk+2l, | =1,2,... 5]. Além disso, os IDM 
podem tanto ser positivos quanto negativos. Tal propriedade é desejável, 
uma vez que indica não apenas a amplitude da contribuição de cada modo, 
mas também a sua direção. 


Modelos em espaço de estados 
Seja o modelo em espaço de estados 


ato) 
, 


y=0Ox (14.6) 


sendo que xEIR", uE IR”, yEIR“ e ACIR"X", BEIR"*" e CER" são 
matrizes constantes. Os IDM para o par de entrada-saída entre a i-ésima 
entrada e a jésima saída são dados por 


diag [yê ê... 1] E -Re (6; BA) 
i= Be vj=lZ..,u, (147) 
sendo que Re(:) indica a parte real, e 
Ã = VIAV 
CjV = [ia en EAR die las tá 

ê; = diag [é] Eni g] 

C=[GG.. o] 
vo B = [bb dh] 
B; = diag [bi Db... DiJ,i=12,..., 
B = [BB,... Bi) 
V =... vn) (14.8) 
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sendo que diag[:] representa uma matriz diagonal com os elementos indi- 
cados, V é a matriz modal e v; é o autovetor associado com o i-ésimo 
autovalor de A. Para sistemas de uma entrada e uma saída, v = u = 1, 
os IDM na Eq. 14.7 coincidem com aqueles das Egs. 14.4 e 14.5, quando 
G(s) = O(s] - AJ! B. 

Os coeficientes d; e c; contêm informação sobre a controlabilidade e 
a observabilidade, respectivamente (SKELTON, 1988; PEREIRA DA SILVA, 
2007). Das Eq. 14.4, 14.5, 14.7 e 14.8, torna-se claro que tal informação é 
incorporada nos IDM. Por exemplo, se a Eq. 14.6 tivesse modos que fos- 
sem fracamente controláveis ou observáveis, quando representada na forma 
canônica de Jordan, os respectivos coeficientes b; ou E; seriam pequenos. 
Portanto, modos fracamente controláveis ou observáveis dificilmente terão 
IDM significativos, independentemente das constantes de tempo envolvi- 
das. Esse resultado é consistente com o conceito de realizações balanceadas 
(Moore, 1981). Em alguns casos, entretanto, o cálculo da matriz modal 
V pode se tornar numericamente malcondicionada e algoritmos mais sofis- 
ticados devem ser usados. 


14.2.2 Algumas propriedades dos IDM 


Os seguintes lemas formalizam resultados importantes para melhor entender 


algumas propriedades dos IDM. 
A resposta de G(s) ao Na unitário pode ser escrita como 


aeto )=>L0 , H(s), (14.9) 


sendo que Kcc/s é a parcela em o permanente (ou parcela “CC”) da 
resposta, e H(s) é a parcela transiente. Além disso, não é difícil verificar 
que Kcc é o ganho em regime permanente (ou ganho-CC) de G(s). 


Lema 14.2.1. O ganho em regime permanente G(s) pode ser expresso em 
termos dos IDM como 


+29 
Kec= 5) q (14,10) 


[n 


Lema 14.2.2. 4 parcela transiente da resposta ao degrau unitário, H(s), 
pode ser expressa em termos dos IDM como 


k k+q 


E? 5-2 Ta) (14.11) 


= Als — A$) 


FE i=k+1 
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sendo 
(JiXPAS + JE MA) 
o titi to, 14.12 
= rr TEM) ga 
D 


Lema 14.2.3. A resposta de G(s) ao degrau unitário pode ser decomposta 
em 


p tt k 
1 e Hi 
sE(s) SF Dat +| do 


i=l 


k+q 
23, Yi [= J (14.13) 


i=k+l 


[a] 


Nos Lemas 14.2.2 e 14.2.3, a resposta do sistema foi decomposta no so- 
matório de respostas de modos reais e complexos. À ressonância de sistemas 
reais pode ser descrita por modos complexos cujos pesos são os IDM. Por- 
tanto, IDM significativos indicam modos que têm forte efeito na resposta 
do sistema. 


Corolário 14.2.1. Os IDM são invariantes com relação a transformações 
de similaridade. 


Demonstração 

A demonstração deste corolário segue diretamente das Eq. 14.4 e 14.5 e do 
fato de que tanto pólos quanto resíduos também são invariantes a transfor- 
mações de similaridade. 


Uma das maiores dificuldades associadas ao procedimento de considerar 
todos os modos lentos como sendo sempre dominantes é que a contribui- 
ção de tais modos para a saída do sistema pode ser pequena. O mesmo 
argumento pode ser utilizado para modos rápidos que às vezes têm forte 
influência na saída do sistema. Tal dificuldade surge do fato de que o cri- 
tério usado normalmente para classificar modos como dominantes não leva 
em consideração de forma adequada as características de regime perma- 
nente do sistema. Ao contrátio, os IDM levam em consideração tanto a 
dinâmica lenta quanto a rápida. O Lema 14.2.3 deixa claro que os IDM 
caracterizam: i) o ganho-CC do sistema (veja também o Lema 14.2.1); ii) a 
parcela transiente da resposta ao degrau unitário, uma vez que tais índices 
são os pesos dos modos de H(s) (veja também o Lema 14.2.2). 
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Em termos gerais, pode-se dizer que os IDM estão para a parte tran- 
siente da resposta ao degrau unitário, H(s), como os resíduos estão para 
a resposta ao impulso do sistema, G(s), com a vantagem adicional que os 
IDM contêm informação sobre o regime permanente, o que não é verdade 
em geral para os resíduos. Outra consegiiência desta característica é que 
os IDM levam em consideração efeitos provocados por cancelamentos, ou 
quase cancelamentos, entre pólos e zeros. Consegiientemente, se um mo- 
do tiver um índice de dominância significativo, isso indica que tal modo é 
importante tanto durante transientes quanto em regime permanente. Esse 
argumento pode ser formalizado considerando-se a energia de cada modo 
na resposta ao impulso. Portanto, modos com mais energia são, em certo 
sentido, dominantes. Outra vantagem potencial dos IDM é que estão re- 
lacionados de forma simples tanto com a energia da resposta ao impulso 
quanto à norma Lo dos respectivos modos, conforme será detalhado nas 
duas próximas seções. Antes, porém, mostraremos um exemplo onde os 
IDM podem ser usados para determinar a ordem de modelos simplificados. 


Exemplo 14.2.1. Escolha de ordem de modelos ! 


Uma aplicação importante dos IDM em problemas de modelagem é a 
determinação da ordem de modelos simplificados, um assunto a ser tratado 
na Seção 14.3. 

Neste exemplo, será usado um modelo de décima ordem, representado 
no espaço de estado, de um sistema de potência originalmente desenvolvido 
por Heffron e Phillips (1952). As matrizes B, C' e A desse modelo são: 


0:70 Dis O + qOresDo vd 
0 00926 0 0 0 


0 0 0 1000 O 
0,4428 21179 21179 0 [BI 


=| 


LAguiRRE, 1994b. 
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-05517 0 -0309 O 0 
-00410 0 -00350 0 0 
0 314,1593 0 0 0 
9,5540 0-6 —-20 O 
Ee 0 0 0 0 “1 
-0,1962 108696 -01672 O 0 
-0,0386 519849 -0,7999 O 0 
-0,0386 51,989 -07999 O 0 
0 0 0 1000 1000 
0 0 0 0 0 

0 0 0 0 0,169 

0 0 0 0 0 

0 0 0 0 0 

0 0 0040 0 

0 0 0 00421 -0,0328 
—10,8696 0 0 0 0 
-41,1153 -10,86960 O 0 0 
-41,1153 -10,8696 -01 O 0 

0 0 1000 =20 0 

0 0 0 10526 -0,8211 


Os autovalores da matriz À são: A =—0,1001, 2,3 = —0,2394 + j 3,2349, 
As = —0,8972 + 9 1,3560, Ag = —2,1313, Ày = —9,6483, Ag = —12,1966, 
Ag 10=-18,9310 + 7 2,0249. 

Na Tabela 14.1 são mostrados os valores acumulados percentuais dos 
IDM para cada par entrada-saída do modelo acima (ver Exercício 14.1). 
É interessante notar como a importância (dominância) dos autovalores de- 
pende do par entrada-saída considerado, Portanto, é importante que, na 
determinação dos pólos mais dominantes, todos os pares entrada-saída se- 
jam ser considerados. 

Outro aspecto importante é notar que para todos os pares do modelo 
acima cinco pólos são responsáveis por pelo menos 97% do valor total dos 
IDM. Portanto, 5 poderia ser a ordem de um modelo reduzido. Entretanto, 
vale a pena notar que os autovalores A23, A4,5 € Ag são dominantes nos 
primeiros três pares de entrada-saída, ao passo que para o último par os 
autovalores M,,5 perdem importância relativa, ao passo que Ay e Ag são um 
pouco mais dominantes. 

Este exemplo ilustra que num modelo multivariável “acoplado”, partes 
do modelo podem ser importantes para caracterizar um aspecto e ser menos 
importantes em outros. [n] 
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TABELA 14.1: Índices de dominância modal 


Nora: Valores acumulados e em percentual dos índices de dominância 
modal para cada par entra-saída do modelo do sistema de potência. 


14.2.3 Os IDM e a energia da resposta ao impulso 


Na presente seção serão estabelecidas relações matemáticas entre os IDM e 
a energia da resposta ao impulso dos modos de um modelo dinâmico. Para 
facilitar a apresentação, os dois próximos lemas resumem alguns resultados 
importantes da literatura (ZHAO et al., 1981). 


Lema 14.2.4. A energia da resposta ao impulso de um modo real da forma 
Gi(s) = cibi/(s — Ai) é dada por 


o ss — (bic)? 
E= À gi(t)dt = “o” (14.14) 


o 


Lema 14.2.5. 4 energia da resposta ao impulso do i-ésimo modo com auto- 
valores complexos A; = —G = jn, com 


pá A 
4=[55 2 m=[ 8 |a-to cm] (1415) 
é dada por 


1 
E+Em = FER) (O (bic + bincin)? + n2(b7 + bn) (O + cê) 
+2n [ici (bê — b2,4) + bibira(cêa — )) (14.16) 
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[a] 


A energia da resposta ao impulso de modos de um modelo pode ser 
descrita em termos dos resíduos, pólos e IDM de tais modos, conforme 
visto nos dois próximos lemas, 


Lema 14.2.6. 4 energia da resposta ao impulso de um modo real pode ser 
expressa como 


2 
= NM 
p= HA, (14.17) 


Demonstração 

A demonstração pode ser facilmente obtida a partir da definição dos IDM 
para modos reais (veja Eq. 14.4). Deve ser notado que A; < 0 e, portanto, 
E; > 0 conforme esperado, D 


A Eq. 14.17 indica claramente que o modo com um índice de dominância 
significativo também terá uma parcela significativa da energia da resposta 
ao impulso. 


Lema 14.2.7. A energia da resposta ao impulso de um modo complexo pode 
ser ezpressa como 

EMA d+ 
A+; B(A + AS)! 


E+En=-2 (14.18) 


Demonstração 

A demonstração deste lema é simples, porém tediosa e, portanto, ape- 
nas uma breve descrição da mesma é dada. Primeiramente, é conveniente 
representar o sistema (14.15) como sendo 


Gi(s) Ci(sl - A)! Bi; 


J; Ji 


= maiiltcas 4 saldo 1419 
sECrm SC im! SA 
sendo 
bic; + dipic; bc; — bic; 
rs iG que 43 i+1Ci ; Ci (14.20) 


Substituindo-se ; da Eq. 14,5, J; (e J$) da Eq. 14.20 e os autovalores 
AiAf = —( + jn na Eq. 14.18 resulta, após algumas manipulações algébricas 
simples, na Eq. 14.16. o 


Deve ser notado que o primeiro termo do lado direito da Eg. 14.18 sem- 
pre é positivo, enquanto o segundo termo pode tanto ser positivo quanto 
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negativo. Se o segundo termo for positivo, claramente se percebe que um 
maior valor do índice de dominância implica em maior energia. Se, entretan- 
to, o segundo termo for negativo, poderia haver um efeito de compensação, 
e uma análise mais detalhada seria necessária. Felizmente, tal análise é sim- 
ples. Para ver isso, precisamos responder à seguinte pergunta: é possível 
aumentar Y e ter uma redução em E; + Ei,1? Das Eq. 14.5 e 14.18, torna-se 
claro que tal hipótese é impossível. 


14.2.4 IDM e a norma Ly 


O objetivo da presente seção é mostrar que a norma Lo, de um modo está 
relacionada ao seu índice de dominância de forma simpies. Para modos 
reais, a relação entre a norma Loo € O respectivo índice de dominância é 


Ji 
ju = A 


|] Iloo=| 7% | + (14.21) 


No caso de modos complexos não se tem uma equação precisa, mas os 
seguintes limites podem ser facilmente verificados 


JiJtju — (JA + JjM; 
dE ir EE) o Horta) (1429) 


sendo que 0;,;+1 são os valores singulares dos respectivos modos da matriz de 
estados na representação balanceada (MooRE, 1981). Vale a pena ressaltar 
que o limite superior na Eq. 14.22 é um tanto quanto conservativo. Através 
de simulações de Monte Carlo, observou-se que tal limite superior pode ser 
reduzido para 0; + o;+1+ | Yi |, conforme será ilustrado no Exemplo 14.2.3. 
Antes, porém, vamos considerar um exemplo que ilustre o uso dos IDM na 
determinação dos modos dominantes de um modelo dinâmico. 


Exemplo 14.2.2. Determinação de modos dominantes 


Considere a função de transferência de um sistema de controle de com- 
bustíveis (PENA et al., 1990): 


0,5521 + 2,77135 + 3,276352 + 3,55095º 
G(s) = 


— 1+7,656s + 13,91752 + 17,30853 + 11,96451' (14.23) 


Os pólos, os IDM e as normas Loo dos respectivos modos de G(s) são 
mostrados nas Tabela 14.2. 


] 
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TABELA 14.2: Pólos, IDM e normas Lo dos respectivos modos 


| Giliw) oo 


[=SRE 
M = —0,8279 
do = 0, 1762 
3 = —0,2213 + 0,7239 | 73 = 0,044 
M = —0,2213 — 50,7239 | qu = 0,044 


Os resultados acima sugerem que À> não é o modo mais dominante, 
ainda que tenha a maior constante de tempo. Os limites inferior e superior 
da norma Loo para o modo complexo são, respectivamente, 3 + 4 = 0,087 
e 2(03 +04) = 0,819 ou 03 +04 +73 = 0,203, se o limite menos conservativo 
for usado. A validade desse novo limite superior é investigada no próximo 


exemplo. 


Exemplo 14.2.3. Determinação de MDI de modos dominantes 


[n] 


Diversas simulações Monte Carlo foram realizadas para ilustrar os limi- 
tes na Eq. 14.22, sendo que resultados típicos de uma simulação envolvendo 


104 modos são mostrados na Figura 14.1. 


———T————T———T——T TT 1 
limite superior conservativo normalizado 
09h É] 


FIGURA 14.1: Normas Lo obtidas por simulação Monte Carlo 


Normas Loo de 10! modos aleatoriamente gerados. Esta figura 
sugere que o limite superior 2(0; + 0;+1) pode ser relaxado para o 
valor mais baixo o;+0;1+%;. Tais limites aparecem normalizados 


na figura, respectivamente, com valores 1 e 0,5. 
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Modos estáveis de segunda ordem foram gerados escolhendo aleatoria- 
mente os parâmetros do numerador e do denominador. A única restrição 
considerada foi que os modos deveriam ser assintoticamente estáveis. 

De forma a permitir uma comparação visual, a norma Lo e os limites 
dos modos gerados na simulação foram todos normalizados de tal maneira 
que todos os possíveis valores da norma estivessem entre O e 1, ou seja: 


 Gi(ju) lloo —2 [4% | 
vs Ho;+om)-2]%|] bi RA) 
A Figura 14.1 revela claramente que o limite inferior está correto (e 
sempre é atingido quando ambos os pólos são reais). A figura também 
mostra que o limite superior normalizado pode ser relaxado de 1 para 0,5. 


Isso corresponde relaxar o limite superior de 2(0;+0;+1) para o;+0; +. 
õ 


Uma das situações onde é de interesse determinar os modos dominantes 
é na simplificação de modelos. Esse assunto será brevemente tratado na 
próxima seção, onde alguns métodos serão discutidos. Nessa seção, o uso 
dos IDM na redução de ordem de modelos também será ilustrado. 


14.3 Métodos para Simplificação de Modelos 


A simplificação ou redução de ordem de modelos preocupa-se em desenvol- 
ver técnicas que permitam, dado um modelo G(s) de ordem n, obter um 
modelo reduzido, R(s) de ordem m < n, que se aproxime do modelo original, 
ou seja, R(s) = G(s). Há diversos aspectos em que dois modelos podem 
ser aproximados, e qual deles usar dependerá grandemente dos objetivos 
da aplicação. Normalmente, deseja-se que as respostas temporais ou em 
frequência sejam próximas, ou seja, L!(R(s)) = r(t) = g(t) = L-MG(s)) 
(para a resposta ao impulso), L-!(R(s)/s) = L-!G(s)/s) (para respostas 
ao degrau) ou, no caso de resposta em freqiência, R(jw) = G(jw). 

A área de redução de ordem de modelos atraiu grande atenção de meados 
da década de 60 (quando a capacidade de processamento de computadores 
era bastante limitada) até o fim da década de 80, sendo que desde meados 
dessa década, especial atenção foi dada à redução da ordem de controlado- 
res. O número de métodos disponíveis é muito grande, e uma revisão, ainda 
que breve, seria totalmente inviável. A seguir, descreve-se um conjunto de 
métodos de simplificação de modelos em tempo tempo contínuo. 


Na presente seção será apresentada uma família de métodos derivados de 


14.3.1 Métodos baseados em aproximações de Padé | 
um método clássico conhecido como o método de aproximação de Padé. | 
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O método clássico de Padé (MCP) 
Seja a função de transferência 


go + 918 +... + 998? 


SU) = jobs ala aa 
Os coeficientes de Padé de G(s) são definidos como mypade O 
-u 
q ho! 
k 
9k— Dj= hj Ch-j 
a = $2Biabos (o (1426) 


ho 


sendo que 9;=0 para i>q, h;=0 for i>n. Os números (c;)2, E IR são 
os coeficientes da expansão de G(s) em série de Taylor em torno do ponto 
s=0 e são conhecidos como os coeficientes de Padé. Suponha que se queira 
obter um modelo reduzido da forma 


ao +as+...+aps? 


DD TERES TA 


(14.27) 

Claramente, R(s) tem p+m+ 2 coeficientes desconhecidos. De forma 
a determinar unicamente tais incógnitas, deve-se impor p+m+ 2 restrições 
linearmente independentes. No método clássico de Padé p+m+ 1 restrições 
são tomadas da Eq. 14.26. A restrição que falta é uma das seguintes: bo=1 
ou bm=1. 

Portanto, para determinar R(s), o seguinte conjunto de equações deve 
ser resolvido a fim de determinar os coeficientes (aiJt-o e (biJi2o: 


1 = bm, 
aq 
=; 
k 
0 -3;=1b; Ck-j 
e EL por pém (14.28) 


O modelo reduzido obtido desta forma será representado por Rp(s) 
indicando que P=p+m+1 restrições de Padé foram utilizadas. 


O método de Padé em torno de duas freqiiências (MPDF) 


A aproximação em altas frequências pode ser feita de forma mais precisa 
utilizando parâmetros de Markov do modelo original G(s) definidos como 
mymarkov O 
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o cpa 
0 ne 


k 
-k — i=1 ni Mk-j 
a Pp Doe oia k>0, (14.29) 
n 


sendo que g;=0 para i>q e h;=0 para i>n. Os números (m;)º, EIR 
são os coeficientes da expansão de G(s) em série de Taylor em torno da 
freqiiência s=o0. Portanto, a retenção de parâmetros de Markov no modelo 
reduzido normalmente melhora o seu desempenho em regime transiente. Os 
coeficientes do modelo reduzido podem, nesse caso, ser obtidos resolvendo-se 
o seguinte conjunto de equações 


1r= bms 
a 
CQ = Te 
k 
Gk- 10; Ck-j 
PR. Ej=id; he fica Pei (14.30) 


bo 


v 
my = am-y—D  bm-j My-j V=0v AH, v+M-I, 
j=1 


sendo P+M =p+m+1 e my O primeiro parâmetro de Markov diferente 
de zero. O modelo reduzido obtido desta maneira será chamado Rp,m(s) 
indicando que P coeficientes de Padé e M parâmetros de Markov foram 
retidos. 


O MPDPF com retenção de pólos (MPDFRP) 


A retenção de pólos dominantes no método clássico de Padé foi originalmente 
proposto por Shamash (1975) com o objetivo de garantir a estabilidade do 
modelo reduzido. Uma restrição para a retenção de pólos tem a seguinte 
forma 


0=bo+bis;+... + bmsf, (14.31) 


sendo que s; é o pólo a ser retido no modelo reduzido, que pode ser deter- 
minado resolvendo-se o seguinte sistema de equações: 
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| bm 
aq 
Mies do 
[ONO Di a) 
q = 4Bjabiol paia. Pl, 


yv 
ds, Da Qm-y—D) bm-j My-jy V=UV+,.,v+M-1 
j=1 
0 = b+ths+.+sP,2=12,...,DP, (14.32) 


sendo que P+M+DP=p+m+1. O modelo reduzido obtido desta forma 
será representado por Rp,m,DP(s) indicando que, além dos P coeficientes de 
Padé e dos M parâmetros de Markov, PD pólos dominantes foram retidos. 


O método de Padé com mínimos quadrados (MPMQ) 


Uma característica comum aos três métodos MCP, MPDF e MPDFRP é 
que o número de restrições utilizadas é igual ao número de incógnitas, a 
saber p+m+2 e, portanto, as restrições são exatamente satisfeitas, ou seja, 
o modelo simplificado retém os pólos escolhidos de forma ezata. 

Por outro lado, se mais que p+m+2 restrições forem impostas, o siste- 
ma de equações resultante será sobredeterminado e terá mais do que uma 
solução. Uma delas pode ser obtida utilizando-se o método de mínimos 
quadrados para determinar os coeficientes de R(s). Esse procedimento tem 
a vantagem de levar em consideração a informação extra, contida nas restri- 
ções adicionais. Isso normalmente resulta em modelos reduzidos de melhor 
qualidade, reduzindo, assim, as chances de obter modelos reduzidos instá- 
veis. 
No MPDFRP, os coeficientes do modelo simplificado, R*(s), (aj), 
e 4b; al podem ser determinados resolvendo-se o seguinte conjunto de 
equações: 


1 = bm, 
ab 
O = 
aj-Djeibj CG 
E E k=1,2,..,P-1+EP, 
v 
my = day bm-jMy-jy | = UPA. VA M-1+EM 
j=1 
0 = botbiss+.. +87, 2=1,2,...,PD, (14.33) 
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sendo que EP é o nimero de coeficientes adicionais de Padé utilizados. O 
mesmo se aplica a EM com respeito aos parâmetros de Markov. 

O modelo reduzido final R(s) pode ser obtido a partir de (a) 
ajustando-se o ganho-CC. Esse ajuste é necessário uma vez que o pri- 
meiro coeficiente de Padé, co, é apenas aproximadamente retido em R(4), 
Portanto, 


co bo 


[E 


R(s) = R'(s) x (14.34) 


Como antes, o modelo reduzido será indicado por Rp,m,pD,EP,EM(s), 
sendo que P+M+PD+EP+EM >p+m+1. Na nomenclatura acima, o 
somatório dos índices indica o número de restrições menos um (correspon- 
dendo a bm =1). 

Vale a pena mencionar que o MCP é um caso particular de MPDF 
quando M =0. Por outro lado, este é um caso particular do MPDFRP 
quando nenhum pólo é retido. Logo, usando a nomenclatura adotada, as 
propriedades mencionadas acima podem ser escritas da seguinte forma: 


Rp(s) C Rp,(s) C Rp,m,pD(s) C Re m,pD ep eM(s), (14.35) 


sendo que os elementos representam famílias de modelos de ordem reduzida 
com o mesmo número de pólos e zeros. Em particular, 


Re(s) = Rpo(s) = Rroo(s) = Rpo0,0,0(8) 
Rpm(s) = Rrmo(s) = Rp,mo0,0(8) (14.36) 
Rem,po(s) = Rpm,po o(s). 


Deve ser notado que o método originalmente proposto por Shamash 
(1975) é um caso particular do MPDFRP, Portanto, o modelo reduzido 
proposto por Shamash é Rpo,pp(s) com P+ PD=p+m+l, 

Pelo fato de os coeficientes de Rpm,pp br eM(s) serem determinados 
por mínimos quadrados, os P+ EP coeficientes de Padé, os M+EM pa- 
râmetros de Markov e os PD pólos são retidos apenas aproximadamente 
no modelo reduzido lepademk O, No que se segue, discute-se um procedi- 
mento de forma a determinar um modelo reduzido utilizando-se o método 
de mínimos quadrados, mas ao mesmo tempo retendo de forma exata um 
determinado conjunto de pólos e zeros. Esse procedimento usa um algo- 
ritmo de compensação dinâmica aproximada em malha aberta, revisto na 
próxima seção. 


l 
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14.32 Compensação dinâmica em malha aberta 


Sejam as funções de transferência (14.25) e (14.27). A função de transfe- 
rência R(s), tal que R(s)G(s) tenha um conjunto predefinido de P coefici- 
entes de Padé e M parâmetros de Markov (co,01,... ,CP-1;My; My, 
“My M-1) Sendo PAM =p+m+1, é dada pela solução do seguinte 
conjunto de equações lineares (AGUIRRE, 1992a): 


1 =YUtm 
YyoCo = To; 


k 
wck = TED Uch-jy k=1,2,... P-1 


j=1 


k 
Rh = Tntm-k= D Untm-jMk-jo k=vp+. pAM-I, 
ja 
(14,37) 


sendo que c; é o iésimo coeficiente de Padé de um modelo de referência 
K(s), m; é 0 iésimo parâmetro de Markov of K (s), my é o primeiro parâ- 
metro de Markov não-nulo de K(s) e 


i 
z= y aj9i-jy = 01,0] +P; (14.38) 
j=0 
i 
w=5) ahi; à=0 nm (14.39) 
j=0 


Esse algoritmo foi originalmente sugerido para aplicações de projeto de 
controladores ou compensadores dinâmicos, Em tal contexto, G(s) é a fun- 
ção de transferência da planta, e R(s) é o controlador a ser projetado de tal 
forma que a malha aberta se aproxime do modelo de referência K(s), ou 
seja, R(jw)G(juw) = K(jw). Tal procedimento de aproximação de modelos 
difere do problema clássico de redução de modelos (onde o modelo reduzido 
todo deve ser determinado) pelo fato de que aqui apenas uma parte, a sa- 
ber, R(s), da função de transferência final R(s)G(s) dever ser determinada, 
sendo que G(s) se mantém fixa. Contudo, a função de transferência em 
malha aberta R(s)G(s) retém coeficientes de Padé e parâmetros de Markov 
de K(s). O caso em malha fechada foi tratado em (AGUIRRE, 1991), sendo 
que ambas as versões estão implementadas em pmcont O. 
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14,3.3 O MPMQ com retenção exata de pólos e zeros 


O problema de simplificação de modelos que usa o método de Padé com 
mínimos quadrados (MPMQ) e com retenção exata de pólos e zeros é seme- 
lhante ao problema de compensação dinâmica aproximada em malha aberta, 
descrito na Seção 14,3.2. A semelhança se deve, entre outros motivos, pelo 
fato de que apenas uma parte do modelo reduzido deve ser determinado, 
uma vez que a outra parte é composta pelos pólos e zeros do modelo original 
a serem retidos no modelo simplificado. Em outras palavras, o problema 
de simplificação de modelos descrito com a nomenclatura do problema de | 
compensação dinâmica aproximada pode ser enunciado da seguinte forma: 
o modelo reduzido desejado é R(s)=k x R(s)G(s), sendo que k é usado para 
corrigir o ganho-CC e G(s) é formada pelos pólos e zeros a serem retidos e 
não precisa ser própria. Neste contexto, o sistema original é K(s). 

Portanto, MPMQ com retenção exata de pólos e zeros pode ser conse- 
guido seguindo-se os seguintes passos: 


1. escolha os pólos e zeros do sistema original K(s) a serem retidos e 
determine G(s); 


2. calcule coeficientes de Padé e parâmetros de Markov do modelo origi- 
nal K(s); 


3. monte um conjunto de P+M-H > p+m+2 equações lineares de (14.37). 
Note que p e m se referem a R(s), a parte do modelo reduzido a ser 
determinado, e não a R(s), que tem q+p zeros e n+m pólos; 


4. determine os coeficientes de R(s) resolvendo o sistema de equações 
usando mínimos quadrados (ver Capítulo 5); 


5. o modelo simplificado é R(s) =k x R(s)G(s), sendo que k satisfaz a 
relação R(0) = K(0). 


Deve ser notado que os coeficientes de Padé e os parâmetros de Markov 
são aproximadamente retidos em R(s)G(s) e não apenas por R(s). Dessa 
maneira 0 ajuste aproximado de tais coeficientes não é prejudicado com a 
inclusão de G(s). Portanto, o procedimento acima é diferente de se obter 
R(s) por meio do ajuste de coeficientes de Padé e parâmetros de Markov, 
numa primeira etapa, e subsegientemente adicionar os pólos e zeros. 


14.3.4 Comentários e exemplos 


Para comparar os diversos algoritmos de simplificação descritos na presente 
seção, inicialmente será considerado que nem pólos ou zeros são retidos, 
ou seja, G(s)=1, q=0, n=0 e R(s) = R(s). Das Eqs. 14.38 e 14.39, 
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toma-se claro que nesse caso (x;)?-9 = (aiJi-o € (no = (biJ?p. Se essa 
subtituição for feita, o conjunto de equações (14.37) torna-se idêntico ao 
conjunto de equações (14,30) e, se M =0, tal conjunto de equações também 
será equivalente a (14.28), 

Seguindo um raciocínio semelhante, é simples verificar que o MPDF com 
retenção de pólos é um caso especial do método MPMQ com retenção exata 
de pólos e zeros quando não são retidos nenhum zero e nenhuma restrição 
adicional de Padé ou de Markov é usada. Nesse caso, o modelo reduzido 
pode ser determinado sem utilizar o método de mínimos quadrados, uma 
vez que o número de restrições utilizadas é igual ao número de incógnitas. 
Consegiientemente, não é necessário corrigir o ganho-CC, ou seja, k=1. 

De maneira análoga, pode ser visto que o método de Padé com mínimos 
quadrados (MPMQ) é um caso especial do MPMQ com retenção exata de 
pólos e zeros quando não é retido nenhum zero, ou seja, apenas quando 
G(s)=1. 

Uma vez que todos os pólos do modelo reduzido podem ser escolhidos a 
priori, a sua estabilidade pode ser garantida. Além disso, se o modelo ori- 
ginal tiver pólos instáveis ou zeros de fase não mínima, essas singularidades 
podem ser retidas no modelo simplificado se desejado. 

Se M >0 no algoritmo (14.3.2), a seguinte restrição deve ser satisfeita 
para garantir que uma solução exista (AGUIRRE 1992): 


(n+m)-(q+p) <v. (14.40) 


No problema de simplificação de modelos, a restrição da última equação 
implica que a diferença entre pólos e zeros no modelo reduzido deve ser 
menor ou igual à respectiva diferença no modelo original. 

Finalmente, por causa da correção do ganho feita no passo 5, o primeiro 
coeficiente de Padé do sistema original também é retido exatamente. 

A seguir, serão discutidos três exemplos que têm o objetivo de ilustrar os 
principais aspectos do método MPMQ com retenção exata de pólos e zeros. 
O Exemplo 14.3.1 mostra como a qualidade da aproximação do modelo 
reduzido pode ser variada em faixas de freqiiências diferentes dependendo da 
combinação de restrições de restrições de Padé e Markov. O Exemplo 14.3.2 
mostra as vantagens de reter exatamente pólos e zeros de fase não mínima 
no modelo reduzido, Finalmente, o Exemplo 14,3.3 ilustra a importância 
de reter pólos que são dominantes. Esse exemplo usa os IDM, descritos na 
Seção 14.2 para determinar quais pólos reter no modelo reduzido. Nos três 
exemplos, a função custo 


Jos =|| Eljuw) Ico, (14.41) 
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foi utilizada para selecionar o melhor modelo reduzido dentre uma famí- 
lia de modelos gerados a partir do método de simplificação. Na Eq. 14.41 
E(jw)=G(jw)- R(jw) e || - Iloo indica a norma Lo 


Exemplo 14.3.1. Simplificação de modelo com pólo quádruplo 2 


Considere a seguinte função de transferência (LEPSCHY; VIARO, 1982) 


2675º + 5275? + 3855 + 100 


Clo= Caras pt rd FI 


5 (14.42) 
que tem um pólo quádruplo em s = —1. O modelo reduzido obtido pelo 
método clássico de Padé é instável. A fim de garantir a estabilidade, pode-se 
impor a retenção de um ou mais pólos do modelo original. O método de 
Shamash (1975) com retenção de três dos quatro pólos do modelo original 
resulta em 2 


E 2428? + 2855 + 100 


Foral) = rg ria 


(14.43) 


Retendo-se dois parâmetros de Markov, um coeficiente de Padé e três 
pólos, resulta em 


— 26752 + 260s + 100 
ESET 

Finalmente, variando o número de restrições de Padé e Markov nas 
faixas I<P<5ep+m+1-P<M <5, e usando o índice (14.41) para 
escolher dentre a família de modelos reduzidos assim gerados, obtém-se o 
seguinte modelo para P=1 and M=3: 


Rias(s) (14.44) 


mr 266,999952 + 281,7190s + 102,7115 
BS) = Topriss + 308135? +3,0813s + 0271" a) 
Como pode ser observado, a Figura 14.2 mostra o ganho e fase de 
Eso3(jw), Er2s(jw) e E(jw). Conforme pode ser visto, R3,0,3(5) é mais 
preciso que Ri,2,3(s) e que R(s) para baixas fregiências, porque tal modelo 
foi obtido usando-se apenas restrições de Padé. A retenção de parâme- 
tros de Markov em Ri 23(s), como esperado, melhora a aproximação em 
altas frequências. O modelo simplificado pode ser melhorado ainda mais 
levando-se em consideração restrições adicionais de Markov e determinando 
os coeficientes do numerador de R(s), usando-se o algoritmo de mínimos 
quadrados. [a 


3Os índices indicam, respectivamente, o número de restrições de Padé, Markov e de 
pólos retidos. 
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so! 


10º 
frequência (rad/s) 


FIGURA 14,2: Resposta em fregiiência de modelos simplificados 


Resposta em fregiiência de (—) | Gi(jw) | — | Rao,(jtw) | 
e dGi(jw)) — AlRsos(jw)); (=) | Gi(jw) | — | Riaa(jw) | 
e A(Gi(jw)) — Rr as(jw)); (- -) | Gi(jw) | - | R(jw) | e 
HGi(juw)) - H(R(jw)). &(-) indica a fase. O diagrama superior 
é o do módulo e o inferior é o da fase. 


Exemplo 14.3.2. Simplificação de modelo com integrador duplo 4 


Considere a função de transferência de um sistema de acionamento de 
quatros discos (ENNS, 1984) 


0,01(0,045º + 0,235s! + 7,135º + 100,0252 + 10,455 + 99,55) 
52(5º + 0,16189 + 6,00451 + 0,582253 + 9,983552 + 0,4073s + 3,982)" 
(14.46) 


G» (s) = 


que tem um par de zeros de fase não mínima em s=2,2616 + 55,1916. O 
modelo simplificado de sexta ordem, obtido o método clássico de Padé, é 
instável. O procedimento seguido quando o modelo original tem pólos na 
origem do plano s é aplicar o método de simplificação à parte da função 
de transferência sem tais pólos e acrescentá-los posteriormente ao modelo 
reduzido. Dessa forma, todos os pólos em s = 0 do modelo original são 
retidos no modelo simplificado. 

Mantendo a diferença entre o número de pólos e zeros e retendo-se o par 
de pólos em s=—0,0282 + ;1,4097, o método de Shamash (1975) resulta em 


“Aguirre, 1994b. 
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k 13685 x 10525? + 0,1669852 + 2,8638 x 10-25 + 0,33074 
6029) = 4 9,3377 x 10-25 + 2,655681 + 1,1100 x 10-153 + 1,9323052" 
(14.47) 


Deve ser notado que, apesar de p+m+1=10, por causa dos dois pólos 
na origem, apenas oito coeficientes precisam ser determinados. 

Desprezando os dois pólos na origem do plano s (que são obviamente 
dominantes), os três pares de pólos complexos podem ser listados em ordem 
decrescente de dominância, segundo os respectivos IDM, como se segue: 
—0,0282+71,4097, —0,0153+50,7648 e —0,0370-+51,8496, Portanto, retendo 
os pólos mais dominantes e usando o índice da Eq. 14.41 para determinar o 
melhor modelo reduzido, obtém-se 


—6,006 x 10-353 + 1,9276 x 10-25? + 4,0747 x 10-25 + 0,48388 
1,08335º + 0,1749155 + 3,1337574 0,2811359 + 1,9095552” 
(14.48) 


Ri(s) = 


para P=5e M=5. Pelo fato do número de restrições levadas em conside- 
ração (dez) exceder o número de incógnitas (oito), tal conjunto sobredeter- 
minado de equações é resolvido usando mínimos quadrados. Retendo-se os 
zeros de fase não mínima do modelo original, o melhor modelo encontrado, 
de acordo como o índice (14.41), foi 


7(0) = 11238 x 107353 + 3,1274 x 10352 + 6,8543 x 10-25 + 1,1336 
halo) = 74 13825 x 10-19 + 4,0156504 3,4332 x 10-153 + 4,5342582" 
(14.49) 


para P=1e M=9, Finalmente, retendo-se os zeros de fase não mínima e 
os pólos em s = —(,0282 + j1,4097, que têm os maiores valores de IDM, o 
modelo 


=310 — 24108 x 105353 + 1,0256 x 10-352 4 2,3345 x 10-25 + 3,8258 x 107! 


É (6) = Sic TA TO EAV EDS ALAS O MA UDAD IR AO CATE DAS 
Falo) = Lorata + 1,4595 x 10-155 + 2,907151 + 2,1326 x 10-153 + 1,53038? 
(14.50) 


foi o melhor encontrado, com P=7 e M=5. 

Com a exceção de Rç,0,2(8), todos os modelos reduzidos neste exemplo 
foram obtidos variando-se o número de restrições de Padé e de Markov 
de zero a dez. Obviamente, apenas aquelas combinações para as quais 
P+M+1> p+m+2 foram consideradas. 

A Figura 14.3 mostra a resposta em fregiiência das funções de transfe- 
rência deste exemplo. Como observado previamente, o modelo reduzido de 
Shamash é o mais preciso em baixas fregiiências, enquanto que o modelo 
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simplificado obtido utilizando-se o maior número de restrições de Markov, 
a saber, RÊ(s), é o mais preciso em altas fregiências. Em particular, vale 
a pena ressaltar que apenas os modelos que retiveram os zeros de fase não 
mínima é que têm erro de fase nulo em altas frequências. 


vo (radis) 


FIGURA 14.3: Resposta em fregiiência de modelos simplificados 
Resposta em fregência de (—) Ga(ju), (- -) R$ma(ju) (= -—) 
Rilju), ('º:) Rê(juw) e (:-- negrito) Ra(juw). 


O melhor modelo simplificado, R3(s), foi obtido quando os pólos mais 
dominantes e os zeros de fase não mínima foram retidos e quando o núme- 
ro de restrições foi o maior. Nesse caso, quatro restrições relacionadas à 
retenção de pólos e zeros foram exatamente satisfeitas, e 12 restrições de 
Padé e Markov foram aproximadamente satisfeitas. Portanto, 16 restrições 
foram usadas para determinar oito parâmetros e isso resulta numa maior 
flexibilidade na determinação de modelos de ordem reduzida. [a] 


Exemplo 14.3.3. Simplificação de modelo de sistema de combustão é 


Seja a função de transferência de um sistema de controle de combustíveis 
(PENA et al., 1990) 


7,5265º + 10,35752 + 0,92051s + 0,63827 


Golo) = 570141547 11,7495% + 16,98757 + 116025 FT" 


(14.51) 
Aguirre, 1994. 
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Essa função de transferência é um tanto difícil de simplificar, pois tem 
dois pares de pólos complexos conjugados, e os pólos mais rápidos são mais 
dominantes de acordo com o índice de dominância modal apresentado na 
Seção 14.2. Em particular, os pólos em s = —0,2795 + j0,8306 têm (em 
valores percentuais) os seguintes índices de dominância modal y = 48,86% 
e para os pólos em s = —(0,0141 + 50,2547 tem-se y= 1,14%. Não é de se 
admirar que o método clássico de Padé resulte num modelo instável, uma 
vez que tal método, como visto, coloca ênfase na baixa freqiiência do modelo 
original e neste caso os modos dominantes são rápidos. 

Portanto, deseja-se que o par de pólos complexos conjugados localizados 
em s=-0,2795+0,8306 sejam exatamente retidos no modelo simplificado. 
Fazendo-se isso no método de Shamash (1975), resulta em 


0,517152 + 0,5433s + 0,0526 


70000557 +0805 00805 (1452) 


Raga(s) = 
sendo que o método de Padé com mínimos quadrados com retenção aprozi- 
mada de pólos produz o seguinte modelo 


— 0,3952552 + 0,0563s + 0,0207 
Rs0261() = 54 0,5285574 0,0100s + 0,0305" (go) 


É interessante notar que, apesar do par de pólos rápidos ter sido usado 
para “retenção aproximada”, foi precisamente o par de pólos lentos que foi 
quase que exatamente retido pelo método! Isso ilustra a condição de ser 
capaz de reter exatamente pólos e zeros. Por outro lado, a importância de 
ser capaz de reconhecer os pólos dominantes pode ser apreciada notando 
que R4,0,2,5,1(8) tem um par de pólos muito próximo dos pólos mais lentos 
do modelo original. No entanto, pelo fato de tais pólos não serem domi- 
nantes, o desempenho de tal modelo reduzido é ruim. De fato, o método 
de Shamash (1975) falha e não produz um modelo simplificado estável se os 
pólos lentos forem preservados. Isso ilustra claramente que os pólos lentos 
não são necessariamente dominantes, conforme discutido na Seção 14.2. 

Finalmente, foi obtido um modelo reduzido com os pólos rápidos e usan- 
do um número de restrições de Padé e Markov variando nas faixas 1I< P <10 
ep+m+1-P<M <10. O melhor modelo de acordo com o índice Jo foi 


0,4591482 + 0,55711s + 0,04947 
— 0,9705653 + 0,6433752 + 0,80177s + 0,077507' 


R(s) (14.54) 
para P=4, M=3. 

As Figuras 14.4 e 14.5 mostram os diagramas de Nyquist e as respostas 
ao degrau das funções de transferência deste exemplo. O gráfico de Ga(jw) 
tem duas voltas. A menor corresponde ao par de pólos lentos. 
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a! 
As + Os º os 1 15 2 25 3 as 


FIGURA 14.4: Diagrama de Nyquist dé'nodelos simplificados 


Diagrama de Nyquist de Me) Galjw), (À) Roaljw) 
(-:—) Rozenliw) e (+++) R(juw). 


(] 6 1 16 20 25 so 35 “0 45 so 


FIGURA 14,5: Respostas ao degrau de modelos simplificados 


Respostas ao degrau de (—) Ga(jw), (- -) Rioa(iw) 
(=) Rioasa(iuw) e (+++) Ri(ju). 


O modelo que aproximadamente retém tais pólos, R40,25,1(s), é o que 
melhor se aproxima ao modelo original em baixas freqiências, mas seu de- 
sempenho como um todo é inadequado. D 
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Aproximação em múltiplas frequências 


Os algoritmos descritos acima faziam a aproximação basicamente em duas 
fregiiências, a saber, s = 0, quando são usados os coeficientes de Padé e, 
quando são usados os parâmetros de Markov, tem-se s = 00. O uso de 
restrições que impõem a retenção de pólos e zeros, bem como o uso de 
restrições adicionais de Padé e Markov tentam, de forma indireta, melhorar 
a aproximação em médias frequências. 

Nesta seção será apresentado um método de simplificação de mode- 
los que faz a aproximação em outras fregiiências, à escolha do usuário. 
O método proposto por Hwang e Lee (1989) permite a aproximação em 
mais de duas fregiiências e é descrito a seguir. 

Seja a função de transferência 


agi +azas +... + ans"! Ao(s) 
G(s) = - ! d = . 14,55 
(s) an +as+...+anst Hans” Ar(s) ( ) 

G(s) pode ser expandida da seguinte forma: 
1 1 
= >" —————+ a 14,56, 
au Ho neh sra)! (14.56) 
sendo 
a31+0328 +... +Qgn-18º72  As(s) 

Gis) = 021 +aps +... +aznst — Aa(s)] (14.57) 


O procedimento acima pode ser continuado de maneira a resultar na se- 
guinte fração continuada do tipo Jordan 


1 
Gg) ==" Hai! (14.58) 
hi+ks+ ro 
hatkasp —2 


sendo que os números reais (h;,k;) são os quocientes parciais, e +jw; são 
as fregiiências em torno das quais G(s) é expandida. A fração continuada 
acima tem infinitos pares de quocientes parciais e frequências de expansão. 
Na prática, entretanto, se deseja-se obter um modelo reduzido de ordem 
m<n, à Eq. 14.58 é truncada da seguinte forma: 
1 
8) = 
e ) hi+khs+ TR 

hat RES 

“hmot Hm 104 SERA 
Uma + Umas +... + Umms"T 1 (14.59) 

Um, + Um,2S +... + Um mes ; 
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Os coeficientes parciais podem ser calculados pelo seguinte algoritmo: 


n=i+2 ; 
Al)= 5 agsli=1Zm+], (14.60) 
j=1 


sendo 
aij = 0;-2942— hi-20;-1942 — ki-204-1,4+1 — W$ 005942 
j=ncitAncitlool, (1461) 


n=i+l 


Pi(s?) = Aua(s)Aiga(- a Pais i=12...m, (1462) 
sendo 2j=1 
pij = (tan paagj-s (14.63) 
ka 
n=i+1 ; 
QUS) = Ails)Ama(=8) + Al-s)An(s) = 55 js 2i=12,...m, 
(14.64) 
sendo 
q =2) (Das pari aj-es (14.65) 
n=i+l 
Ri) = a ils) Aa(s) E» gb = Do my 
(14.66) 
sendo 2 
rij = 25 (aspas apr (14.67) 
k=1 
Finalmente, os quocientes parciais são dados por 
h=0,5X o E f=12...n (14.68) 
e 
Ril-u?) 
dd dar Er MB (14.69) 
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Os coeficientes da expansão truncada G,(s) podem ser obtidos direta- 
mente a partir dos quocientes parciais da função de transferência original 
G(s), como se segue: 


vistg = hiadig + katia + UZvi tj + viga, 
=D r=1jslB d+, (14.70) 


um = higatig + kitig + Qui + uid, 
i=1M e r=lj=1%. 142, (14.71) 


com 
vi =0, vi=ua=Lua=h,uw2=h 


Vi-1,-1 = Vi-10=UO=U-,-1=U-10=UWo=0, 


Portanto, a fim de determinar os m pares de incógnitas, m frequências e 
expansão devem ser escolhidos. A escolha de tais fregiiências pode ser crítica 
e é aconselhável determinar uma família de modelos simplificados variando- 
se as fregiiências de expansão numa faixa de valores. Deve-se observar que 
uma peculiaridade do presente método é que a diferença de pólos e zeros 
do modelo reduzido é sempre um. Isso pode ser desvantajoso em problemas 
onde tal diferença é maior para o modelo original. 


Exemplo 14.3.4. Aprozimação em múltiplas fregiiências 8 


Considere a seguinte função de transferência que corresponde à linea- 
rização de uma malha de controle de combustíveis em torno do seguinte 
ponto de operação BFG (gás de alto-forno)=38,78%, COG (gás de coque- 
ria)=16,05%, BOFG (gás de aciaria)=27,73% e 6leo=17,44%: 


8,185º + 12,4228º + 9,0543s + 1,3879 


G(s) = Tga04si + 33,2605 + 18,72552 + 10,195 1" 


(14.72) 

No presente exemplo, duas fregiências de expansão foram fixadas em 
Orad/s, e a terceira fregiência foi variada na faixa de 0,1 a 2,0 rad/s. A 
norma Loo foi usada para selecionar o melhor modelo reduzido: - 


0,804952 + 0,7835s + 0,1328 


2,450153 + 1,2963552 + 0,9153s + 0,0957" pus 


Gn (s) = 
SAGUIRRE, 1994a. 
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com freqiiências de expansão (0,0 0,0 0,6420) rad/s. Por outro lado, 
escolhendo-se as fregiiências de expansão (0,0 0,0 1,0440) rad/s, obtém-se 
o seguinte modelo reduzido: 


vo (radi) 


FIGURA 14.6: Respostas em fregiiência de modelos simplificados 


Respostas em frequência de (—) G(jw), (- -) Gr(jw) e 
(=:—) Gra(juw). As fregiiências diferentes de zero, em torno das 
quais foi feita a aproximação, são indicadas com círculos. 


0,918752 + 0,6385s + 0,1062 

2,561853 + 1,266752 + 0,7405s + 0,0765' 

A Figura 14.6 mostra as respostas em fregiiência do modelo original, bem 
como dos modelos reduzidos. As fregiências diferentes de zero, em torno 
das quais foi feita a aproximação, são indicadas com círculos. Note como 
as respostas coincidem em tais fregiiências, além w = Orad/s, que também 
foi usada como frequência de aproximação. Isso revela que o presente mé- 
todo é muito flexível e eficaz, permitindo obter modelos aproximados que 
tenham a mesma resposta em frequência que o sistema original em pontos 
predeterminados. D 


Gra(s) = (14.74) 


Leitura Recomendada 
O problema de dominância modal é abordado em praticamente todos os 


livros básicos de controle (FRANKLIN et al., 1986; OGATA, 1993). O índice 
de dominância modal foi definido pela primeira vez em (AGUIRRE, 1993). 
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Com relação aos métodos de aproximação de modelos baseados na téc- 
nica clássica de Padé, um dos trabalhos mais influentes foi o de Shamash 
(1975). A partir do início da década de 80 até o início da década de 90 
muitos trabalhos foram publicados nessa área. Em particular, diversos mé- 
todos, variantes do método clássico de Padé, surgiram como alternativas 
que garantiam a estabilidade do modelo reduzido. Dentre esses vários mé- 
todos, destacam-se aqueles discutidos em (LEPSCHY; VIARO, 1982; LUCAS; 
Munro, 1991; AGUIRRE, 1992, 1994b, 1995; AGUIRRE; MENDES, 1994). 
Finalmente, a aplicação de tais métodos em problemas de compensação 
dinâmica foi tratado em (AGUIRRE, 1995b, 1998). 


Exercícios 


14.1. Determine os índices de dominância modal para o modelo apresentado 
no Exemplo 14.2.1, 
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Identificação Caixa Cinza 


15.1 Introdução 


Até o presente capítulo a ênfase tem recaído sobre técnicas de identificação 
caixa preta. O que caracteriza tais técnicas é que nenhuma informação so- 
bre o sistema está disponível além dos dados, ou, se disponível, não é usada 
no procedimento de obtenção do modelo. Nesse caso, apenas dados de en- 
trada e saída do sistema são usados durante a identificação. A escolha da 
representação e da sua estrutura é feita de forma empírica nos casos mais 
simples. Em casos mais complexos, como, por exemplo, na identificação de 
sistemas não-lineares, essa escolha é crítica, o que justifica o uso de mé- 
todos mais sofisticados para seleção da estrutura do modelo, como aqueles 
abordados no Capítulo 11. Tais métodos baseiam-se em técnicas de álgebra 
linear e em conceitos de estatística. 

Em modelos obtidos por identificação caixa preta normalmente não exis- 
te nenhuma relação óbvia entre a estrutura e os parâmetros de tais modelos 
com aspectos físicos do sistema sendo identificado. Por isso, na estimação 
de parâmetros utilizam-se procedimentos de otimização sem restrições. 

Na identificação caixa branca, ou simplesmente modelagem física, o pro- 
cesso de obtenção do modelo baseia-se em leis e princípios físicos. Todos os 
parâmetros são conhecidos, ou previamente determinados. Dados de entra- 
da e saída do sistema, quando disponíveis, são usados apenas para validar 
o modelo. Na identificação caixa branca, todos os termos da estrutura, e 
seus parâmetros, possuem significado físico (GARCIA, 2005). 

Essas duas formas de modelagem podem ser interpretadas como os dois 
extremos de técnicas de modelagem. Qualquer procedimento que não esteja 
em nenhum desses extremos pode ser classificado como sendo uma técnica 
de identificação caixa cinza. Essa área de conhecimento busca combinar 
as vantagens dos procedimentos de identificação caixa preta e caixa branca. 
Nesse caso, tanto dados de entrada e saída obtidos do sistema quanto algum 
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outro tipo de informação são usados na identificação. O tipo de informação 
adicional utilizada, assim como o nível de conhecimento, varia de caso para 
caso. 

Um termo muito utilizado na literatura é: conhecimento a priori. Ape- 
sar de não haver uma definição formal para tal conhecimento, parece adequado 
chamar de conhecimento a priori “apenas” a informação oriunda das leis fí- 
sicas que regem o processo, e qualquer outra informação, ainda que esteja 
disponível antes de se obter o modelo final, será chamada informação au- 
ziliar (NEPOMUCENO, 2002). Evidentemente, se a informação auxiliar dis- 
ponível não estiver de acordo com os dados, seu uso na identificação caixa 
cinza poderá acarretar em um modelo com desempenho pobre. 

De maneira geral, os modelos caixa preta são obtidos com maior faci- 
lidade. O sucesso de tais modelos depende fortemente da qualidade dos 
dados (dinâmicos) usados. Pode-se dizer que bons modelos caixa preta só 
são possíveis se as séries temporais usadas (dados dinâmicos) contiverem to- 
da a informação a respeito do sistema que se deseja modelar. Infelizmente, 
a aquisição de tais dados nem sempre é possível. Por outro lado, em muitos 
casos, informação auxiliar já está disponível e seu uso na identificação con- 
tribui significativamente para a melhora do modelo obtido (MURANKAMI; 
SEBORG, 2000; ABONYI et al. 2001). A identificação caixa cinza, como 
será visto, permite obter modelos de abrangência mais global mesmo com 
dados limitados a certa região de operação (FUNKQUIST, 1997). Similar- 
mente, é possível que informação a priori esteja disponível na forma da 
estrutura do modelo e que os seus parâmetros sejam estimados a partir de 
dados dinâmicos. 

Assim como as redes neurais e as RBF's, a representação NARMAX 
polinomial foi concebida para aplicações de identificação caixa preta. Porém, 
devido a certas características algébricas (CORRÊA, 2001; AGUIRRE et al., 
2002), a representação polinomial permite, com relativa facilidade, usar 
informação auxiliar tanto na fase de seleção de estrutura (AGUIRRE et al., 
2000) quanto na estimação de parâmetros (CORRÊA et al., 2002). Algu- 
mas das idéias desenvolvidas para modelos polinomiais NARMAX no con- 
texto de identificação caixa cinza são adaptáveis a outras representações 
(AMARAL, 2001). 

A seguir, alguns resultados desenvolvidos recentemente na área de iden- 
tificação caixa cinza serão descritos, Maiores detalhes podem ser encontra- 
dos nas referências citadas na seção de Leitura Recomendada deste capítulo. 


15.2 Aproximação da Característica Estática 


Em muitas situações reais há conhecimento a priori sobre a resposta em 
estado estacionário do sistema. Mesmo que não haja tal conhecimento, 


au 
Digitalizado com CamScanner 


15.2 APROXIMAÇÃO DA CARACTERÍSTICA ESTÁTICA 547 


frequentemente é possível obter tal informação auxiliar por meio de alguns 
testes em estado estacionário. Na presente seção e na próxima, serão des- 
critas técnicas que permitem utilizar essa informação na identificação de 
modelos. 

O assunto da presente seção requer a leitura do Complemento 10.5. Para 
facilitar a leitura, a expressão (10.73) será reescrita da seguinte maneira: 


Eo + ui + Dio Punii” 


1 som deli T FE 
1- Ly — mo p= Eyrunotam — Spuo DypjP=! 


(15.1) 


Deve-se notar que (15.1) é equivalente às raízes da seguinte equação: 


i=l 
(2,)7+ (> Boat) pol+.. 
atoa O i=t-1 : Elo 
pscdê ( >» Put) P+ ( > Bquii! - ) +) But =0, 
i=0 i=0 i=0 
(15.2) 
Se max(p] = 1, a Eq. 15.1 se reduz a 
Do +Bã+ Dto uni? 
ja ui + Dm=2 Du (15.3) 


EI E 
1-D, - Dm= Byuni” 


Se maxlp] = 1 e By =0,j = 1,2,...,m, ou seja, se não houver termos 
cruzados, a Eq. 15.3 pode ser simplificada como 


Do + Eyã + Déo PuniM 

1-D, . 
Se o modelo tiver termos cruzados da forma Lyum, m = 1,2,... ,£, à função 
estática será racional e terá apenas uma solução. Por outro lado, se não 
houver termos cruzados, tal função será polinomial, 

Com tais observações em mente, suponha que a informação sobre o 
comportamento em estado estacionário do sistema possa ser expressa da 
seguinte maneira: j = f(ii) sendo f uma função racional, como (15.3), ou 
polinomial, como (15.4), ou mesmo na forma mais geral (15.1). Em tais 
casos é possível usar tais equações para escrever restrições sobre os coefici- 
entes de agrupamentos, restrições essas que podem ser utilizadas durante a 
estimação de parâmetros. Na presente seção, tais restrições serão usadas no 
contexto de programação não-linear e serão atendidas de forma aproximada. 
Na próxima seção, um procedimento diferente será utilizado de maneira a 
poder atender as restrições de forma exata. Em ambas as seções assume-se 
que o problema de escolha de estrutura (ver Seção 11.3) já foi resolvido, 


O procedimento será apresentado na forma de algoritmo (CORRÊA, 
2001). 


j= (15.4) 
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1. Conhecendo-se a forma da função j) = /(), limite os agrupamentos de 
termos candidatos àqueles consistentes com a forma da função estática 
y = f(ú). A discussão na p. 608 ilustra como fazer isso em um caso 
real. 


2. Usando algum procedimento de escolha de estrutura, como, por exem- 
plo, a taxa de redução de erro descrita na Seção 11.3, escolha os re- 
gressores significativos dentre os agrupamentos de termos selecionados 
no passo 1. O número de termos a serem incluídos no modelo pode ser 
determinado utilizando critérios de informação, como será discutido 


na Seção 12.3. 


se a saída do sistema tiver somente um estado estacionário então 


3. a função estática será do tipo j = f(). Se o modelo não tiver termos 
cruzados, tal função será polinomial tal como (15.4), que pode ser 
escrita na forma 


j=w+mitait+..+açil, (15.5) 


Por outro lado, se o modelo tiver termos cruzados, y = f(ú) será 
racional, como (15.3), que pode ser escrita como! 


— ataútail+...+aril 

“E toras ba. ba do 

4. Usando informação em estado estacionário, estime os parâmetros da 
Eq. 15.6, a saber, 00,1,2,..4 € boa,2,.t-1- 


5. Usando (15.3) ou (15.4), escreva as equações que relacionam os coefi- 
cientes a9,1,2,..,4 € bo,1,2,. 4-1 da função estática f(+) aos coeficientes 
de agrupamentos do modelo, Por exemplo, se f(:) for polinomial, tais 


equações serão 
Zoo = 
TEM SM 
DO sd (15.7) 
cê = q 


!Nas duas últimas equações, as constantes ag,,2,.., € Do,1,2m..t=1 evidentemente 
relacionam-se com os coeficientes de agrupamento, conforme visto nas equações (15.4) 
e (15.3), respectivamente, Essa relação será detalhada no passo 5. 
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6. Use o conjunto de Egs. 15.7 como restrições durante a estimação de 
parâmetros. 


senão se o modelo tiver £ estados estacionários múltiplos, então 


7. a função estática será do tipo (15.2), que poderá ser representada por 
1=a07t+ feat! +... + fam + (oo + fo(a), (15.8) 


em que ay é uma constante que depende dos coeficientes de agrupa- 
mento. ft-14-2,..,1,0 São funções polinomiais em , cujos coeficientes 
também dependem dos coeficientes de agrupamento. 


8. Assume-se que, para uma dada entrada àc, pelo menos um estado 
estacionário da saída 7, é conhecido .2 Substituindo úç na Eq. 15.8, 
tem-se: 


= wjttamgt+...+ ao)? + mj+ ao, (15.9) 


sendo 7 = jo uma das raízes admissíveis dentre as ( raízes da Eq. 15.9 
e art. 10 = ft-14-2,. 1,0(Tc). 


9. Os coeficientes da Eq. 15.9 devem ser determinados de tal forma que 
uma de suas raízes seja yc para um dado d., ou seja, Je = f(c) deve 
ser verdadeiro. 


10. Igualando-se os coeficientes dos termos em 7 de mesma potência em 
(15.2) e (15.9), resulta em relações algébricas entre os coeficientes dos 
agrupamentos de termos do modelo e os coeficientes a na Eq. 15.9, 
obtidos no passo 9 a partir de informação auxiliar. 


11, Escreva as equações algébricas obtidas no passo 10 na forma de res- 
trições sobre os coeficientes de agrupamento. Tais restrições serão 
utilizadas na estimação de parâmetros, no passo 12. 


fim se 


12, Utilize algum método de otimização para estimar os parâmetros do 
modelo, cuja estrutura foi selecionada no passo 2, levando-se em conta 
as restrições determinadas nos passos 5 ou 11. 


13. Valide o modelo encontrado. 


2Evidentemente, variando-se le ao longo de uma faixa de operação resultará em um 
conjunto de valores correspondentes de je. 
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Vale a pena notar que as restrições agem sobre os coeficientes de agru- 
pamentos, que por definição são o somatório de parâmetros do modelo (ver 
Definição 10.5.1), ao invés de restringirem diretamente os próprios parâme- 
tros. Assim sendo, há infinitas combinações de parâmetros que satisfazem 
as restrições impostas sobre os coeficientes de agrupamento. Isso permite ao 
algoritmo escolher, dentre os modelos que atendem aos requisitos de ajuste 
à função estática, aqueles com melhor desempenho dinâmico, em termos da 
minimização do somatório do quadrado dos erros de predição de um passo 
à frente. 

No exemplo a seguir o algoritmo do elipsóide (BLAND et al., 1981; 
SALDANHA et al. 1999) será utilizado para restringir os coeficientes de agru- 
pamento, Na próxima seção uma variante do estimador MQ será utilizado. 


Exemplo 15.2.1. Uso do algoritmo do elipsóide na estimação de parâmetros * 


O sistema considerado no presente exemplo é o conversor estático CO- 
CC do tipo buck, Esse sistema é descrito em maiores detalhes na Seção 16.4. 
Deseja-se utilizar o conhecimento prévio da relação de tensão em estado 
estacionário representada pela Eq. 16.18 e ilustrada na Figura 16.20. 

Levando-se em conta apenas o formato geral da Eq. 16.18, torna-se evi- 
dente que bastaria ao modelo polinomial identificado conter termos dos 
agrupamentos Do, Ly e Eu para ser capaz de aproximar tal relação estática. 
Um tal modelo, cujos parâmetros foram estimados utilizando o estimador 
MQ, é mostrado na Eq. 16.16. Esse modelo pode ser escrito na forma geral 
(10.19) como 


lh) = cro(Ly(k — 1) + cro(2)y(k — 2) + co + con(Iu(k — 1) 
+ero(3)y(k — 3) + con(3)u(k — 3). (15.10) 
Além disso, a relação estática entre a entrada e a saída de (15.10) é 
Y=mi+ao, (15.11) 


sendo 


(15.12) 


Os coeficientes de agrupamentos do modelo mostrado na Eq. 15.10 são os 
seguintes: Dy = co1(1) + co 1(3), Dy = cro(1) + ci,0(2) + cro(3) e Do = co- 
A Eq. 15.11 tem a mesma estrutura que a função estática do conversor buck 


3Corrêa et al. 2002. 
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(16.18). Como Va = 24V, tem-se que ao = 32V e aj = -8. Assim, para 
garantir que o modelo tenha as mesmas características em estado estaci- 


onário que o sistema, as seguintes restrições precisam ser satisfeitas (ver 
Exercício 15.1): 


-e<Lo+32D,-1)<e 

| -e<L,-8D,-1)<e, (15.13) 
em que é = 0,01 é a precisão requerida na aproximação, valor esse escolhido 
de forma um tanto quanto arbitrária. Na prática, entretanto, a escolha de 
é será influenciada pela aplicação específica, como, por exemplo, quando o 
modelo identificado for usado no projeto de controladores robustos. Usando- 


se o algoritmo do elipsóide (AE) para levar em conta as restrições (15.13) 
durante a estimação de parâmetros, obteve-se o seguinte modelo: 


| vb) = 0,6983y(k-1)+1,37x 10-2y(k—2)+13,4897-3,6260 u(k— 1) 
| -0,1335 y(k — 3) + 0,02537 u(k — 3). (15.14) 


A Figura 15.1 mostra as simulações livres dos modelos (16.16) e (15.14). 


e ua 
% 10 10 120 190 140 150 16 


FIGURA 15.1: Validação de modelos identificados para o conversor buck 


(—) Tensão de saída de um conversor buck. Simulação livre de 
modelos identificados: (-.-) modelo (16.16) estimado por MQ e 
(- -) modelo (15.14) (CorrêA et al., 2002). O eixo horizontal 
indica o número de amostras, e o vertical, a tensão em volts. 


Claramente, percebe-se que o desempenho dinâmico do modelo (15.14) 
é inferior, apesar de sua função estática ser indistinguível da real (16.18). 
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Isso aponta para o fato de que, em alguns casos, será necessário fazer um 
compromisso entre o desempenho em estado estacionário e o desempenho 
dinâmico. A fim de ilustrar esse ponto, no restante do presente exemplo será 
feito o seguinte: alguns regressores não-lineares serão incluídos no modelo 
a fim de conferirem a este maior flexibilidade dinâmica. Por outro lado, 
analisando-se a estrutura da Eq. 16.18, percebe-se que tais regressores são 
espúrios do ponto de vista estacionário. 

Assim, escolheu-se uma estrutura que fora determinada anteriormente 
utilizando-se o critério da taxa de redução de erro descrita na Seção 11.3 
(AGUIRRE et al., 2000) 


v(k) = co(Dy(k—1) +cro(2)y(k — 2) + co + co a(Du(k — 1)º 
+ero(3)y(k—3)+co a (L1,3)u(k—1)2u(k—3) +co 2(3)u(k 3)? 
+co2(L,3)u(k — 1)u(k — 3) + co s(1,3,3)u(k — 1)u(k — 3)2, | 


(15.15) 

cuja relação estática é: | 
7=ast+ai?+ao, (15.16) 

sendo (ver Exercício 15.2) | 
a= Der ado (15.17) 


Os coeficientes de agrupamento do modelo (15.15) são (ver Seção 10.5): 
Lys = co3(1) + co,3(1,1,3) + co,s(3) + co,3(1,3,3); Eye = co,2(1,3), Lo = co e 
z, = ci,o(1) ap ci,0(2) + cr,0(3). 

Ajustando-se a estrutura polinomial da Eq.15.16 à característica 
estática conhecida (16.18), os seguintes parâmetros foram estimados: 
a3 = 0,4391; a; = —3,3710 e aj = 26,2696. 

Portanto, o problema de identificação não-linear com restrição de parã- 
metros consiste em estimar os parâmetros da estrutura (15.15), de tal forma 
que a correspondente equação estática seja: 


7 = 0,4391%º — 3,3971072 + 26,2696. (15.18) 


Uma maneira de se fazer isso é relacionar a informação em estado es- 
tacionário equacionada em (15.18) com os coeficientes de agrupamentos — 
utilizando as relações (15.17) — e então estimar os parâmetros levando em 
consideração as restrições levantadas, 

A partir de (15.17) e (15.18), as restrições sobre os coeficientes de agru- 
pamentos são (e = 0,01): 
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-€<04991(1-Dy)- Ds <e 
-€< 39710 (1 — By) - Ds <e (15.19) 
-€< 26,2696 (1 — Dy) — Dy < e. 


A Tabela 15.1 apresenta os parâmetros estimados por MQ e pelo al- 
goritmo do elipsóide (AE). Note-se que [ag — ao); |a3 — az) e Jaz — as] são 
sempre menores que e = 0,01 para o caso do AE. 


TABELA 15.1: Parâmetros estimados por MQ pelo algoritmo do elipsóide 
(AE) para modelos do conversor buck, 


MQ | AE 

ll) | 12013 | 0,7315 
êo(2) | -0,2608 | -0,0047 
ê 62479 | 13,7292 

êoa(3) | -2,6783 | -0,8280 
êro(3) | -0,2080 | -0,2495 
êoa(1,1,3) | 8,8699 | 3,6774 
êoa(3) | 3,6636 | 2,0210 
êo2(1,3) | -0,6162 | -1,7617 
ê92(1,3,3) | -9,7707 | -4,6409 
ao | 23,3488 | 26,2659 

a | -2,8029 | -3,9704 

a 0,2037 | 0,4391 


FonTE: (CORRÊA et al., 2002). 


No presente exemplo é interessante observar que os dados dinâmicos 
estão restritos a uma estreita faixa de operação, situação comum em muitas 
outras aplicações. Por outro lado, a informação da curva estática, que no 
presente exemplo é informação a priori, abrange toda a faixa de operação 
do sistema. Isso ilustra um dos potenciais da identificação caixa cinza, a 
saber, neste caso não foi necessário um teste dinâmico que excursionasse o 
sistema de forma ampla, 

As Figuras 15.2 e 15.3 mostram o desempenho dinâmico e estático de 
dois modelos identificados utilizando-se a mesma estrutura. Um deles teve 
seus parâmetros estimados por MQ e o outro teve seus parâmetros estimados 
Jevando-se em conta as restrições (15.19), Os valores dos parâmetros de 
ambos os modelos estão mostrados na Tabela 15,1. 


Digitalizado com CamScanner 


554 15 IDENTIFICAÇÃO CAIXA CINZA 


' 
so 100 no 120 130 140 150 160 


FIGURA 15.2: Validação de modelos identificados para o conversor buck 


(—) Tensão (em volts) de saída de um conversor buck. Simula- | 
ção livre de modelos identificados usando-se a estrutura (15.15) | 
e estimando-se os parâmetros com (ver Tabela 15.1): (-"-) esti- 
mador MQ e (- -) AE (CORRÊA et al., 2002). | 


1 1,5 2 25 Ko] 35 4 
FIGURA 15,3: Características estáticas de modelos identificados 


(—) real, De modelos com parâmetros estimados usando-se (ver 
Tabela 15.1): (-:-) estimador MQ e (- -) AE (CORRÊA et al., 
2002). O eixo horizontal indica o valor da entrada (volts) e o 
vertical indica a saída (volts), ambos em estado estacionário. 
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Observando-se essas figuras, percebe que o modelo estimado usando-se 
as restrições (15.19) tem um comportamento em estado estacionário bem 
melhor do que o estimado por MQ na faixa i < 2V em detrimento do 
desempenho dinâmico, 

Finalmente, deve ser notado que o desempenho dinâmico do modelo 
(15.15) estimado pelo AE é significativamente melhor do que (15.14) à cus- 
ta de uma pequena piora na característica estática deste, que é indistinguí- 
vel da real. Portanto, existe o compromisso entre o desempenho dinâmico 
e estático. Uma maneira de atribuir peso diferenciado para cada tipo de 
desempenho é a escolha da tolerância e. Valores de e muito pequenos ponde- 
ram fortemente o desempenho em estado estacionário, ao passo que valores 
maiores relaxam as restrições impostas sobre a função estática do modelo 
identificado, permitindo, assim, melhorar seu desempenho dinâmico. [a] 


Uma das vantagens do procedimento descrito nesta seção é que as res- 
trições aparecem na forma de desigualdades. Assim, a precisão € torna-se 
um parâmetro de projeto uma vez que, como discutido acima, ela pode ser 
utilizada para se variar o peso dado à característica estática no processo de 
modelagem. Para usar tais restrições de desigualdade, foi empregado o algo- 
ritmo do elipsóide. Esse algoritmo é bastante intenso computacionalmente, 
ao contrário do procedimento que será descrito na próxima seção. 


15.3 Ajuste Exato da Característica Estática 


A presente seção abordará o mesmo problema tratado na seção anterior. 
As principais diferenças são duas. Primeiramente, ao contrário de usar 
restrições na forma de desigualdades, as restrições usadas nesta seção serão 
igualdades. Consegiientemente, a característica estática será exatamente 
reproduzida pelo modelo, ao invés de aproximadamente, como era o caso 
na Seção 15.2. Em segundo lugar, o estimador utilizado não é um algoritmo 
não-linear, mas trata-se de um estimador MQ com restrições. Tal estimador 
foi apresentado no Complemento 5.3. 


15.3.1 O problema 


Assume-se que para O sistema em estudo existem dois conjuntos de da- 
dos, a saber: i) M pares de valores em estado estacionário do sinal 
de entrada ú = (ih,...,dM) e os M valores correspondentes da saída 
3 = (di... ,9M); é ii) um conjunto de dados dinâmicos (u(k), y(k)), 
k=1,...,N, O objetivo é obter um modelo NARX polinomial com de- 
sempenho dinâmico compatível com os dados (u(k), y(k)) e desempenho 
em estado estacionário coerente com a informação em (ii, J). 
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Em alguns casos a relação em estado estacionário de um sistema pode ser 
recuperada, diretamente ou depois de análise, a partir de dados de operação 
normal. O número M de valores em estado estacionário não precisa ser 
grande (tipicamente menor que dez), mas é desejável que (i,... UM) 
excursione uma ampla faixa de valores de entrada. Os dados dinâmicos 
devem ser obtidos seguindo os procedimentos descritos no Capítulo 12 ou 


análogos. 


15.3.2 Ajuste exato da característica estática 


O ajuste exato da característica estática, conforme descrito nesta seção, 
está construído sobre dois fundamentos. Por um lado, tem-se a represen- 
tação da característica estática de um modelo NARX polinomial a partir 
dos seus parâmetros. Isso foi descrito no Complemento 10.5. Por outro 
lado, será utilizado o estimador de mínimos quadrados com restrições MQR 
que permitirá estimar um modelo que possua uma característica estática 
previamente definida. O algoritmo MQR foi descrito no Complemento 5.3. 
O procedimento pode ser resumido em três etapas. 


1. Ajuste uma função algébrica da forma j = f(7,ã) aos dados em estado 
estacionário (0,Y). A escolha da função f foi discutida de forma 
preliminar na Seção 15.2 e o será, de forma mais completa, a seguir. 


2. Usando (15.1) e a função f estimada no primeiro passo, escreva as 
restrições sobre os coeficientes de agrupamento na forma (5.56). 


3. Finalmente, use os dados dinâmicos (u(k),y(k)), k = 1,...,)N eo 
estimador MQR (5.58) para estimar os parâmetros de um modelo, que 
terá f por característica estática, e que se ajuste aos dados dinâmicos 
no sentido de mínimos quadrados. 


O último passo pode ser facilmente efetuado utilizando-se o estimador 
MQR (5.58), mas os dois primeiros passos requerem um cuidado um pouco 
maior, conforme será visto a seguir. 

Se não for possível ajustar uma determinada função f aos dados, a 
estrutura do modelo, ou até mesmo a sua representação, deverá ser trocada. 
Uma função f mal ajustada provavelmente resultará em um modelo com 
um desempenho fraco em estado estacionário. 

Ao se escolher a função f, duas perguntas devem ser respondidas: i) o 
sistema apresenta estados estacionários múltiplos? Ou seja, dada uma en- 
trada, há mais de um valor possível para a saída?) ii) A dinâmica do sistema 
varia com o ponto de operação, ou apenas o ganho varia, como no caso de 
modelos de Hammerstein? As respostas a essas perguntas ajudam na de- 
terminação da função f, como será visto a seguir. 
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a. Se o sistema tiver Ng pontos fixos simultâneos, então todos os agrupa- 
mentos de termos do tipo Ny»um, com p > No (independentemente do 
valor de m) devem ser descartados do conjunto de termos candidatos 
(veja Seções 10.5 e 10.6). 


b. Se a dinâmica do sistema não varia com o ponto de operação, como no 
caso de modelos de Hammerstein, todos os agrupamentos de termos 
do tipo NMypum com pt O em £0, ou seja, todos os termos cruzados, 
devem ser eliminados do conjunto de termos candidatos. 


O próximo passo é ajustar uma função f aos dados em estado esta- 
cionário. Para isso, deve ser notado que a Eg.15.1 pode ser simplificada 
dependendo das respostas dadas às perguntas acima. Para sistemas com 
apenas um estado estacionário, a função estática polinomial terá a forma 


o 
= 1(0) = Eneas”, Vb fl (15.20) 


se a dinâmica (autovalores do sistema linearizado) não variar com o ponto 
de operação — não haverá termos cruzados no modelo e o denominador de 
(15.1) será uma constante. Ou terá a forma 


14 E. 
Dm=o Gm” 
a Ei E 
1=by — Dm=a Omi” 


se a dinâmica variar com o ponto de operação. Em (15.20) e (15.21), 
0912,» t € bi2,.. + são constantes diretamente relacionadas aos coeficien- 
tes de agrupamento, como pode ser visto comparando tais equações com 
(15.1). 

Assumindo que o sistema tem mais de um estado estacionário, a fim de 
que o modelo seja capaz de reproduzir tal característica, é imprescindível 
que possua termos de agrupamentos SLpum, para qualquer valor de m e 
Pp>1. Nesse caso, a função estática terá a forma j = f(y,i), pois haverá 
monômios em y (e possivelmente 4? ou mesmo monômios de grau superior) 
no denominador de (15,1), 

Se f for polinomial, como na Seção 15,2, o estimador MQ pode ser 
utilizado para estimar tal função, No caso de f não ser linear nos parâme- 
tros (esse será o caso quando o denominador de (15,1) não for constante), 
algoritmos de otimização não-linear deverão ser utilizados. No exemplo dis- 
cutído a seguir, será utilizado um algoritmo quase-Newton para esse fim 
(BAZARAA et al, 1993). 

A estimativa da função f é uma aproximação ao comportamento em 
estado estacionário do sistema, conforme representado nos dados (1, y). A 
fim de levar tal informação em conta durante a identificação de um modelo 


v=f(a)= (15.21) 
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dinâmico, uma relação entre f e tal modelo deve ser estabelecida. Conforme 
discutido no Complemento 10.6, tal relação pode ser obtida utilizando-se 
os conceitos de agrupamento de termos e seus coeficientes. De fato, a re- 
lação que existe entre f e os parâmetros do modelo dinâmico pode ser 
escrita na forma da Eq. 5.56, em que os elementos do vetor c são os co- 
eficientes da função f. Por exemplo, se f for como em (15.21), então 
c=[a0a a: bi bo --:]T e S será uma matriz com zeros e uns co- 
locados de tal forma que todos os elementos de 8 que correspondem a um 
determinado agrupamento são somados entre si e feitos iguais a a; ou b;. O 
restante do procedimento é direto, bastando aplicar o estimador (5.58). 

Acredita-se que o procedimento descrito nesta seção seja útil especial- 
mente na identificação de sistemas do tipo Hammerstein para os quais só é 
possível ou conveniente realizar testes dinâmicos em torno de um ponto de 
operação. Em tais sistemas, o ganho varia com o ponto de operação, mas 
os autovalores, que caracterizam a dinâmica, permanecem aproximadamen- 
te constantes. Como os dados dinâmicos disponíveis foram obtidos com o 
sistema operando em torno de um ponto, tais dados não contêm toda in- 
formação do comportamento do sistema em estado estacionário. Por outro 
lado, se o teste dinâmico tiver sido bem executado (ver Capítulo 12), a 
dinâmica, que é aproximadamente constante, estará bem representada nos 
dados. A característica estática do sistema pode então ser estimada a partir 
de dados em estado estacionário ou mesmo dados de operação normal. Es- 
ses dois conjuntos de dados (dinâmico e em estado estacionário) podem ser 
simultaneamente levados em conta no processo de identificação por meio do 
procedimento descrito na Seção 15.2, bem como na presente, 


Exemplo 15.3.1. Uso do estimador MQR na estimação de parâmetros * 


O presente exemplo considera a montagem de laboratório descrita na 
Seção 16.6. No presente exemplo, a seguinte informação auxiliar foi uti- 
lizada: testes em estado estacionário revelaram que, na faixa considerada 
de valores de entrada, a função estática f é aproximadamente quadrática e 
sem saturação, como pode ser constatado na Figura 16.27. Além disso, o 
sistema não apresenta multiplicidade de estados estacionários, Dados dinâ- 
micos foram obtidos aplicando-se uma entrada aleatória, como ilustrado na 
Figura 16.24. 

Como o sistema não apresenta multiplicidade de estados estacionários 
para a mesma entrada, os agrupamentos de termos da forma N4,» com p > 1 
não precisam ser considerados como candidatos para comporem o modelo. 


“AGUIRRE et al., 2004. 
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Além disso, observando-se os dados medidos em estado estacionário (Figu- 
ta 16.27), decidiu-se aproximar a característica estática do sistema por uma 
função f quadrática. Consegiientemente, termos pertencentes aos agrupa- 
mentos Num com m > 3 foram descartados. Usando-se a taxa de redução 


de erro, o critério de informação de Akaike e o estimador ortogonal de MQ, 
O seguinte modelo foi obtido: 


v(k) = 1,2929y(k — 1) + 0,0101u(k — 2)u(k — 1) + 0,0407u(k — 1)? 
—0,3779y(k — 2) — 0,1280u(k — 2)y(k — 1) 
+0,0957u(k — 2)y(k — 2) + 0,0051u(k — 2)2. (15.22) 


Deseja-se agora obter um outro modelo que possua o mesmo conjunto 
de regressores, mas que tenha uma característica estática predeterminada. 
Como visto acima, o primeiro passo é ajustar uma função f aos dados em 
estado estacionário. A função estática de (15.22) é (ver Eq. 10.73): 


(15.23) 


que é racional e, portanto, não-linear nos parâmetros. Usando-se um algo- 
ritmo quase-Newton, FBGS, e usando-se como condições iniciais os valores 
estimados pelo estimador MQ sem restrições, ou seja, usando-se a função es- 
tática de (15.22), os seguintes valores de coeficientes de agrupamento foram 
obtidos c = [By Eyu Ly)” = [0,0615 — 0,0360 0,9128]". Seguindo o se- 
gundo passo no procedimento proposto, obteve-se o seguinte conjunto de 
restrições na forma c = S0 (ver Exercício 15.3): 


[7 

[7 
0,0615 0110001 [7] 
-003600 |=|0000110||4|- (15.24) 
0,9128 1001000]|& 

% 

[4 


Portanto, o estimador MQR (5.58) leva em conta as restrições (15.24) e 
estima (ver passo 3) os parâmetros do modelo 


vb) = 12796y(k — 1) + 0,0178u(k — 2)u(k — 1) + 0,0408u(k — 1)? 
—0,3668y(k — 2) — 0,2565u(k — 2)y(k — 1) 
+0,2205u(k — 2)y(k — 2) + 0,0029u(k — 2)?, (15.25) 


que por construção tem a desejada função estática 


0,061572 


E esta a (15.26) 
1-0,9128+0,03604 


y 
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O desempenho dinâmico e em estado estacionário do modelo (15.25) 
pode ser apreciado nas Figuras 15.4 e 15.5, respectivamente. 


FIGURA 15.4: Simulação livre de modelo identificado 


(—) medição; (o) modelo (15.25). O desempenho do modelo 
(15.22) é praticamente idêntico ao do modelo (15.25) e não é 
mostrado. 


ese pm 
] o 02 03 04 os 08 O 08 09 
bary 


FIGURA 15.5: Características estáticas de modelos identificados 


(—) medição; (x) de modelo (15.25), que é a função (15.26), 
(-:-) de modelo (15.22). 


! 
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O erro quadrático médio normalizado, RMSE (ver Eq. 13.1), dos mo- 
delos (15.22) e (15.25) é 0,0094 e 0,0073, respectivamente. O desempenho 
dinâmico de ambos os modelos é muito próximo, contudo, apenas o mo- 
delo (15.25) tem a função estática especificada, que está mais próxima da 
medida, conforme pode ser notado na Figura 15.5. D 


15.4 Uso de Informação Auxiliar em Redes 


Esta seção descreverá como utilizar informação auxiliar em redes. Na pri- 
meira parte, que é análoga às Seções 15.2 e 15.3, será discutido como é 
possível usar informação sobre a característica estática durante o treina- 
mento de redes do tipo perceptron multicamadas (MLP) (AMARAL, 2001), 
bem como de redes RBF (ALVES, 2004). Na segunda parte, será mostrado 
como é possível aproximar fluxos simétricos utilizando-se redes MLP e RBF 
garantindo-se a simetria do fluxo produzido pela rede. O assunto de análise 
de fluxos e campos vetoriais foi abordado em (TÓRRES, 2007; MONTEIRO, 


2006). 


15.4.1 Aproximando a característica estática em redes MLP 


O procedimento básico para a aproximação da característica estática em 
redes MLP é parecido ao que foi seguido nas Seções 15.2 e 15.3 para mode- 
los NARX polinomiais. A principal diferença é que ao se analisar a função 
estática de uma rede NARX MLP o resultado será uma função f fortemente 
não-linear nos parâmetros. A vantagem disso é que com tal representação 
fica mais fácil descrever sistemas fortemente não-lineares. Para isso, entre- 
tanto, será necessário usar algoritmos específicos para treinar a rede. Um 
procedimento para esse fim será descrito tomando como base um caso sim- 
ples, mas evidentemente que o procedimento é bem mais geral. 

Seja uma rede MLP com quatro neurônios na camada de entrada, três 
neurônios na camada intermediária (um dos quais é não-linear do tipo tan- 
gente hiperbólica) e um neurônio linear na camada de saída. A equação 
dessa rede pode ser escrita como (AMARAL, 2001) 


uk) = wu y(k—1)+ uma Walk —9)+ 
wa tanh(wru(k — 1) + wa u(k — 2), (15.27) 


sendo tanh a função tangente hiperbólica. A função estática da rede (15.27) 
é obtida substituindo todos os regressores da saída e entrada por j e à, 
respectivamente, o que resulta em (ver Exercício 15.5) 
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UW2zy ' 
j=[—————E > | tanh((w,, + uni). 15.28 
! (; = Wan WI — ST (tn + und) ( ) 


A função estática j = f(ã) em (15.28) é da forma 


7 = atanh(azã), (15.29) 
com 
a (a) 
1 Way — Um Uno 
a2 = (us +Un): (15.30) 


Se a função estática do sistema sendo modelado, conforme representada 
nos dados em estado estacionário, não puder ser aproximada satisfatoria- 
mente por (15.29), quaisquer que sejam os valores de ay e aa, isso sugere 
que a topologia da rede não é adequada. 

Supondo que a topologia seja adequada, então é possível estimar a, e 
ao à partir dos dados estáticos que resultem em uma boa aproximação. 
Isso pode ser feito utilizando (15.27), os dados em estado estacionário e um 
algoritmo de treinamento convencional tal como o de retropropagação do 
erro. 

Os valores estimados serão utilizados para escrever as restrições. As- 
sim, a rede final pode ser treinada resolvendo-se o seguinte problema de 
otimização com restrições de igualdade 


: Ns 2 
min Dia n(y—9) 
.. u2 s 
Sujeito a TT) q 


(wma + una) = 02. 


Exemplo 15.4.1, Aprozimando a característica estática em rede MLP 8 


O presente exemplo considera a montagem de laboratório descrita na 
Seção 16.6 e também utilizada no Exemplo 15.3.1. 


S AMARAL, 2001. 
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O primeiro passo é determinar uma topologia suficientemente flexível 
para a rede. Recomenda-se a leitura das referências relacionadas a esse 
assunto mencionadas na seção Leitura Recomendada do Capítulo 10. 

Seja, portanto, uma rede com os regressores (variáveis na camada de 
entrada) u(k— 1), u(k— 2), y(k— 1) e y(k — 2); quatro neurônios na camada 
oculta — três com funções de ativação gaussianas e um com linear — e um 
neurônio linear com bias na camada de saída. A equação dessa rede é: 


Ú(k) = 2, 6 (ns tulk=Drugu(é=2)? + 025,6 Was ulk= 1) tuna gu(h=2)) + 
+ ma,p6 (rag ulk= Durga u(h=2)? +uzaviay(k— 1) + 
+uz a Wa y(k — 2) + UW26+ (15.31) 


que pode ser reescrita em estado estacionário como 


Ú = gyer(zau)? + age (ram)? + mãe (zou)? +77. (15.32) 


As constantes x; foram estimadas diretamente do arquivo de dados em Ê 
estado estacionário estat3 O, 


' 
Finalmente, o treinamento da rede com imposição da característica es- E 
tática (15.32) se reduz à solução do seguinte problema de otimização (ver ES 
Exercício 15.4) ' 
q 
La 2 [ 
min » qu 9) (15.33) E 
1 
sujeito a 5 
W2y =m 
(1 = war — UZa Wi 
Wa =23 
(1 uaawia — Uia) 


Was =25 
(= wu — Up Wa) 

Ways =27 
(= wu — UU) 
Wtg + WI = T2 
Wiag + Wa = Tá 


Wiza + Wiga = T6 


O desempenho dinâmico e estático da rede treinada é mostrado nas 
Figuras 15.6 e 15.7, respectivamente. 0 
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FIGURA 15.6: Simulação livre da rede MLP identificada 


os, 


(—) medição; (- -) rede (15.31) treinada resolvendo-se (15.33) 
(AMARAL, 2001). 


04 02 o3 04 05 08 07 o8 o 
u 


FIGURA 15.7: Característica estática da rede MLP identificada 


As curvas medida e da rede (15.32) são praticamente indistin- 
guíveis (AMARAL, 2001). 
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15.42 Aproximando a característica estática em redes RBF 


A fim de introduzir o conceito de maneira gradual, será primeiramente apre- 
sentado o caso em que apenas um valor (ns = 1) da função estática será 
imposto ao modelo. Posteriormente será abordado o caso geral. 

Um modelo RBF (ver Eq. 10.10) é consistente com a informação de 
estado estacionário disponível no par (1,91) se, para uma entrada constante 
u(k)=ú,k=1,2,...,0 valor da saída em estado estacionário satisfizer 


n= jim y(k). (15.34) 


Para conseguir isso, o modelo deve atender (ver Eq. 10.92) 


Ne 
n(1-Dy)- WE, —uwo = Do uó(I Yi-e; ||), (15.35) 


i=1 


em que 


P= [rd dm)”, (15.36) 


ny Nu 


sendo que, em princípio, &(:) pode ser qualquer função radial. O vetor 
% será chamado de ponto de restrição em estado estacionário. Para que 
um dado modelo (10.10) exatamente ajuste o ponto em estado estacionário 
(1,91), é suficiente que os parâmetros do modelo ô satisfaçam (ver Eq. 15.35 
e Eq. 10.93) 


Ne 
Dwlllyi =; |) = di (L = Dy) = MDu — vo, 


Dy = 
t=1 
Ny 
EL = aj (15.37) 
ja 
Ny 
Di = Db 


É importante perceber que as restrições sobre os parâmetros em (15.37) 
podem ser escritos na forma 


b=sô, (15.38) 
em que S € IRtXº, sendo q =dim[9] = Ne +1+ny+nu, é 


b= [wo Du Ly Eu]”. (15.39) 
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Portanto, o estimador (5.58) pode ser utilizado no treinamento de uma rede 
RBF que terá um ponto em estado estacionário previamente especificado, 
a saber, (1,71), além de minimizar a variância do vetor de resíduos. 


Exemplo 15.4.2. Característica estática em redes RBF: o caso den; =1º 


Deseja-se identificar um modelo RBF simples, com ny = 1, ny =2e 
Nç = 4. Nesse caso, o conjunto de restrições (ver Eq. 15.37) é b = 86 com 


b=[v Dv Dy Bu] 


1 0 0 0 0 000 
s=| 0 HUi=el) dlsi=enl) AUli=esll elfi=cal) 0 0 0 
ei hiO 0 0 0 0 1.10::0 

0 0 0 0 0 0:13 
d=[o tr io a iu à db da)”. 


A Figura 15.8 mostra os dados dinâmicos e estáticos no domínio de 
funções de base de entrada. Esses dados estão descritos em maior detalhe 
na Seção 16.6. 


025 


ulk-2) 


FIGURA 15.8: Domínio de entrada de funções de base 


Para modelo RBF com ny = 1, Nu = 2. Os pontos representam 
os dados dinâmicos Z = [u(k) y(k)], e os círculos representam os 
dados em estado estacionário (Ze,dt)- 


SAGUIRRE et al., 2007. 
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Valores em estado estacionário são mostrados com círculos. Como esses 
valores são conhecidos, pode ser interessante utilizá-los no treinamento de 
uma rede RBF, de maneira a restringir tal modelo a aproximar a função 
estática do sistema. No presente exemplo, será utilizado apenas um valor 
em estado estacionário (ns = 1), que será indicado por J,. 

Em (15.39) os valores de wo, Ew, Ly € Eu — Ou seja, o vetor b — devem 
ser conhecidos antes de se impor as restrições. Uma maneira de fazer isso 
é utilizar o estimador MQ para obter uma primeira estimativa do vetor de 
parâmetros. Em Ô encontra-se uma estimativa para wo, e outros elementos 
podem ser combinados para obter-se valores para By e Ly (ver as últimas 
expressão em 15.37). Usando wo, Ly, Pu € os dados em estado estacioná- 
rio (11,91), By pode ser calculado facilmente a partir da primeira equação 
(15.37). À exceção de wo, os demais parâmetros são normalmente de- 
terminados de maneira livre pelo estimador MQ. As restrições atuam sobre 
Du, Ly é Eu, portanto, não há restrições nos parâmetros em si. Contudo, 
neste exemplo, além de wo, à necessariamente será igual a Zy, pois a re- 
de somente tem um termo linear em y. Se o modelo incluísse y(k — 1) e 
vy(k — 2), a restrição seria Dy = à1 + à», dando alguma liberdade para que 
o estimador determine à e às. 

Finalmente, os parâmetros do modelo RBF devem ser re-estimados a 
fim de garantir que o novo modelo tenha o ponto em estado estacionário 
imposto utilizando-se o estimador (5.58). [a 


A seguir será abordado o caso em que ns > 1, ou seja, deseja-se que 
a rede RBF tenha mais de um ponto em estado estacionário previamente 
especificado. Se for possível aumentar ng bastante, pode-se, pelo menos em 
princípio, impor toda a informação do estado estacionário disponível, ou 
seja, y = F(ii,j). No caso ns > 1, a única restrição em estado estacioná- 
rio (10.92) tornar-se-á o seguinte conjunto de ng restrições 


Ne 
DLL) = lu wo => wi (|) e = e), E= 1,23... 9n5, (15.40) 


i=l 


em que 
Fe=[ge..dy dec)", t=1,2,... ms (15.41) 
Nas Ny 


Logo, para que uma dada rede RBF (10.10) tenha o conjunto de ns pontos 
em estado estacionário (iip,jt), é suficiente que o vetor de parâmetros ô do 
modelo satisfaça (ver Eq. 15.40 e Eq. 10.93) 
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E 
H 


Ne 

Lo= Suwóllve=e |) =de(1-Dy) = WBu wo, t=12,...,ns 
i=1 
a 

à = 5a (15.42) 
j=1 

Ny 

> bi. 

i=l 


Como anteriormente (veja o final do Exemplo 15.4.2), as restrições (15.42) 
também podem ser escritas como (15.38) e (15.39). Portanto, o estimador 
em (5.58) pode ser utilizado para treinar modelos RBF que, além de mini- 
mizer à variância do vetor de resíduos, terão um comportamento em estado 
estacionário previamente especificado. 


Eu 


Exemplo 15.4.3. Característica estática em redes RBF: o caso den; >1” 
Seja a rede com ny = 1, ny =2,ns=3e Ne =9. Além disso, imagine 
que se deseja que essa rede tenha o seguinte conjunto de pontos em estado 


estacionário: (71,72:73), logo £ = 1,2,3. Nesse caso, tem-se 


b=[w DL Zé Zi By Eu)” 


Do sigo Or AD OL SO ADM 10 RODO TO 0) QRO 
O sa s12 813 S14 S15 S16 S17 S18 819 00 0 
g=/0 Sm sz sos 24 526 S26 Sat S28 Soo 000 
O s31 S32 533 834 835 836 Sar 838 839 00 0 |" 
00 0 0 0 0 0 0 E 
Qu “0: 0 0 0 0 0 0 [RR RD 1 
sendo 
Ne 
su=> óIlye-e; 
i=l 
e Zi, Ly é Du são dados em (15.42). [a] 


TAGUIRRE et al., 2007. 
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Exemplo 15.4.4, Modelagem caixa cinza de um aquecedor 8 


O presente exemplo considera a montagem de laboratório descrita na 
Seção 16.6 e também utilizada nos Exemplos 15.3.1 e 15.4.1. Os dados 
dinâmicos utilizados são aqueles mostrados na Figura 16.24 e os dados em 
estado estacionário, utilizados como fonte de informação auxiliar, são as 
medições mostradas na Figura 16.27. 

A topologia de rede utilizada neste exemplo foi 


19 
uh) = (Il y(k — D) — es 1) + mlk — 1), (15.43) 


i=l 


em que y(k=1) = [u(k — 1) u(k—2)..u(k — mu], e; = [eia cio. + Cima)” 
eny =2. No vetor de entrada da RBF somente foi utilizada a variável u(k). 
Isso se deve à constatação de que tal processo é tipicamente um processo do 
tipo Hammerstein (ver Seção 10.2.2), em que somente a entrada está sob 
o efeito da não-linearidade (AGUIRRE et al., 2005). A inclusão do termo 
linear y(k — 1) é motivada pela dinâmica aproximadamente de primeira or- 
dem, típica de processos térmicos em malha aberta. Essa escolha é baseada 
em informação a priori, ao passo que os valores em estado estacionário, 
que serão utilizados no treinamento da rede, constituem-se em informação 
auxiliar. 

Para compor o modelo (15.43) foram produzidos 200 centros candidatos 
distribuídos uniformemente na janela de tempo correspondente aos dados. 
Subsegiientemente, a taxa de redução de erro (ver Seção 11.3) foi usada 
para escolher os melhores centros dentre os candidatos. O número total 
de parâmetros foi escolhido como o dobro do número de pontos em estado 
estacionário utilizados, ou seja, Nc + 1 = 2max(ns). As funções de base 
foram do tipo gaussiana com o = 0,392, sendo que esse valor foi obtido por 
tentativa e erro, 

Diversas simulações foram feitas, em que a topologia da rede era sempre 
a mesma, mas o número de pontos em estado estacionários impostos sobre 
a rede variou, Os detalhes estão descritos em (AGUIRRE et al., 2007). 

Como esperado, para a rede sem restrições (ns = 0) o desempenho 
dinâmico é o melhor, pois todos os graus de liberdade são utilizados na 
minimização da função custo baseada em dados dinâmicos, Jmq. Por outro 
lado, para a rede sobre a qual foram impostos ns = 9 pontos estacionários, 
alguns dos graus de liberdade da rede são utilizados para restringir o com- 
portamento do modelo em estado estacionário. Visualmente, não é possível 
distinguir o desempenho dinâmico das redes treinadas com ns = 0 e com 
Ns = 9 e que, por sua vez, são indistinguíveis da simulação mostrada na 


SAGUIRRE et al, 2007. 
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FIGURA 15.9: Funções estáticas de redes RBF 


(—) Medição; (o) redes. Em (a) tem-se a rede sem restrições 
e em (b), a rede com ns = 9. Os nove pontos em estado es- 
tacionário impostos sobre a rede foram (a partir da esquerda): 
2º, 4º, 7º,8º, 9º, 109, 12º, 15º,16º. 


Figura 15.4. A Figura 15.9 mostra o desempenho dessas duas redes, onde 
fica evidente o resultado da imposição da função estática. õ 


15.4.3 Simetria em redes MLP 


Considere a expressão de uma rede MLP apresentada em (10.13) e repetida 
aqui por conveniência 


u(k) = fo (bs + Dust; (1:+ Dose) É | 
j=1 


i=l 


em que foi explicitada a dependência das entradas x; com o tempo. Uma tal | 
rede pode ser facilmente escrita em termos de uma autoregressão usando-se 
ny atrasos no sinal de entrada 7; = u(k — 1), à = 1,2,... Mu € ny atrasos 
no sinal de saída zn,+t = U(k — 0), E = 1,2,... my. Nesse caso, a saida da 
rede passa a ser uma de suas entradas em iteração futura. Essa recursão 
torna a rede um sistema dinâmico discreto de ordem ny. 

Excitando-se a rede com um sinal de entrada constante, ou seja, toman- 
do i=u;=u(k-i),i=1,2,...,Nu, em estado estacionário a rede con- 
vergirá para valores constantes se for assintoticamente estável. Tais valores 
da saída são indicados por 7 = un,+t = y(k — 0), L = 1,2,... My. Assim, 
em estado estacionário, a rede pode ser escrita como 
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i=nyut 


p= (3 Bjo (ese B uso pp 4) . (15.44) 
j=1 i=1 


As soluções de (15.44) para ii = O são os pontos fixos da rede, Veja a 
Seção 10.6 para o análogo polinomial. 


Para que uma rede autônoma, ou seja, com ú = 0, tenha algum ponto 
fixo igual a zero, ela deve satisfazer 


ts ( +53 ut; 69) 
j=1 


fo (bs + w7f), (15.45) 


o 
NH 


em que notação vetorial foi usada na segunda equação. Como o vetor de 
pesos w e o bias são estimados minimizando-se uma função do erro, nor- 
malmente é muito difícil escolher uma função de ativação que satisfaça exa- 
tamente (15.45). Por outro lado, se a rede não tiver nenhum parâmetro de 
bias, (15.45) pode ser reescrita como 


0= fo p “40) = fs(w'h). (15.46) 


j=1 


A condição (15.46) pode ser facilmente satisfeita se fy = 0, ou seja, se 
S(0)=0, j=1,...,N;e fs(0) = 0. 

A fim de prosseguir, chame-se F(:) a função estática de uma rede autôno- 
ma sem termos de bias. Deseja-se derivar as condições para que a rede tenha 
pontos fixos que sejam simétricos com relação à origem, ou seja, deseja-se 
que: se 7 for um ponto fixo, então —jj também o será. Matematicamente, 
tem-se as seguintes condições: 


1-P(j)=0 e -j-P(-7)=0. 


Em outras palavras, as seguintes equações devem ser satisfeitas: 


e afgu(eE) 
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Tais condições serão satisfeitas, por exemplo, se as funções de ativação f; 
e fo forem fmpares. Portanto, se todas as funções de ativação de uma rede 
MLP forem fmpares e os parâmetros de bias forem todos iguais a zero, 
caso a rede tenha pontos fixos além do trivial em j = 0, tais pontos fixos 
serão simétricos com respeito a = 0. Nesse caso, se a rede tiver apenas 
um ponto fixo, esse estará na origem. Além disso, tal resultado permanece 
válido para qualquer número de camadas escondidas, do tipo de função de 
ativação (desde que sejam fmpares), e mesmo que a rede tenha funções de 
ativação distintas (AMARAL, 2001). 

As condições mencionadas acima não são necessárias do ponto de vis- 
ta matemático. Para ver isso, basta lembrar que uma rede MLP é um 
aproximador universal e, teoricamente, seria possível ajustar pesos e parâ- 
metros de bias, de tal maneira que F(-) seja ímpar mesmo sem as funções 
de ativação o serem. Na prática, entretanto, diversos aspectos não-ideais 
no treinamento resultam em redes que não são matematicamente simétricas 
na maioria dos casos. 

Na próxima seção serão derivadas as condições para se ter simetria em 
redes RBF, nas quais as funções de ativação são, por definição, funções pares 
(ver Seção 10.2.5), mas, antes, o procedimento desta seção será ilustrado 
por meio de um exemplo. 


Exemplo 15.4.5. Garantindo simetria em redes MLP º 


O sistema considerado no presente exemplo é o oscilador de Duffing- 
Ueda, cuja identificação foi investigada nos Exemplos 12.2.2 e 12.3.1. O 
alvo é obter redes a partir do conjunto de dados mostrado na Figura 12.6, 
que sejam capazes de reproduzir o diagrama de bifurcação mostrado na 
Figura 12.3. Em particular, é interessante notar que o oscilador em ques- 
tão apresenta uma bifurcação do tipo forquilha para 4 = 6,8. Esse tipo 
de bifurcação requer simetria e é estruturalmente instável, ou seja, qual- 
quer desvio da condição de simetria perfeita descarta a possibilidade de tal 
bifurcação ocorrer (MONTEIRO, 2006). 

Escolhendo-se w(k) = u(k—1), ua(k) = u(k—2), ua(k) = y(k—1), 
ua(k) = y(k—2) e us(k) = y(k—3), apenas dois neurônios na camada ocul- 
ta, ou seja, m = 2, um dos quais tem função de ativação fi(-) = tanh(:), e 
o outro f>(-) = tanh(:) ou fa(:) = lin(:), em que “lin” indica que a saída do 
neurônio é uma combinação linear das suas entradas. Em ambos os casos, 
o neurônio de saída é linear, ou seja, fs(:) = lin(:). Tais redes serão res- 
pectivamente referidas como HHL e HLL, sendo que nenhuma delas possui 
parâmetro de bias. Para efeito de comparação, outras duas redes foram 


P AGUIRRE et al., 2004. 
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treinadas, mas com seus respectivos parâmetros de bias. Tais redes serão 
referidas como HHLB e HLLB. 

Um algoritmo do tipo Levenberg-Marquardt foi utilizado para o treina- 
mento. Dez termos de ruído foram incluídos no vetor de entrada da rede, 
ou seja, a rede era do tipo NARMAX. As condições inicias foram escolhidas 
de maneira aleatória, e para reduzir a influência do acaso, 100 treinamentos 
independentes foram realizados para cada topologia. À Figura 15.10 mostra 
diagramas de bifurcação típicos para cada uma das topologias testadas. 


FiGuRA 15.10: Diagramas de bifurcação de redes MLP 


(a) HLL, (b) HLLB, (c) HHL e (d) HHLB. As redes dos gráficos 
(b) e (d), que têm parâmetros de bias, não conseguem aprender a 
simetria de forma perfeita e consequentemente não reproduzem 
a bifurcação do tipo forquilha (AMARAL, 2001). 


Como pode ser observado, a presença do parâmtro de bias impede que as 
redes treinadas reproduzam as bifurcações do tipo forquilha (a supercrítica o 
para A x 6,8 e a subcrítica para À x 8). 

É interessante notar que a bifurcação vista na Figura 15.10b para A = 6,6 
não é do tipo forquilha, mas trata-se de uma bifurcação sela-nó, como 
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detalhado na Figura 15.11. Em todos os casos simulados, bifurcações do 
tipo forquilha só foram observadas nas redes HLL e HHL. 


(a) Bifurcação forquilha (b) Bifurcação sela-nó 


Figura 15.11: Instabilidade estrutural da bifurcação forquilha 


Na bifurcação forquilha (a), o ramo original estável perde estabi- 
lidade dando origem a dois ramos estáveis. No caso sem simetria 
(b), o ramo original não sofre qualquer bifurcação e o segundo 
ramo estável surge por meio de uma bifurcação sela-nó. Linhas 
pontilhadas indicam ramos instáveis. 


Diversas outras simulações foram realizadas com outras topologias de 
rede MLP. Os resultados observados foram análogos aos da Figura 15.10. 
Uma observação interessante é que o uso de restrições de simetria tornou 
as redes menos sensíveis a mudanças na sua topologia e problemas devidos 
à sobreparametrização. [a] 


15.4.4 Simetria em redes RBF 


A presente seção discutirá um procedimento pelo qual é possível garantir 
simetria em uma rede do tipo RBF. Deve ser apreciado que, pelo fato de 
tais redes sempre possuírem funções de ativação pares (ver Seção 10.2.5), o 
procedimento desenvolvido para redes MLP é indadequado. 

Um dos problemas cruciais na identificação de redes RBF é a escolha 
dos centros c; em (10.8). Somente se tais centros forem escolhidos antes da 
estimação dos pesos w; é que a rede se torna linear nos pesos. Há diversas 
maneiras de se escolher os pesos e não é raro encontrar autores que o façam 
de forma aleatória. Uma outra alternativa é considerar todos os possíveis 
centros como candidatos e usar a taxa de redução de erro (ver Seção 11.3) 
para escolher os melhores candidatos (CHEN et al., 1990). 

Para facilitar a compreensão do procedimento a ser seguido, considere- 
se uma rede RBF composta de apenas duas funções de base e que tenha 
dimensão unitária, ou seja, os centros são escalares. Depois da estimação dos 
pesos a partir de dados produzidos por um sistema com simetria, a função 
estática da rede poderia ser como a mostrada na Figura 15.122. Pelas 
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mesmas razões apresentadas no contexto de redes MLP, é necessário que 
a função estática seja fmpar para garantir certas propriedades dinâmicas 
de simetria. A fim de garantir tal característica, duas ações podem ser 
tomadas, como detalhado a seguir. 


Escolha de centros simétricos 


Um ponto-chave para se obter uma função estática fmpar usando uma rede 
RBF é que os seus centros sejam simétricos. Para se obter isso, basta 
escolher centros baseado em um dos procedimentos disponíveis e, para cada 
centro escolhido, incluir na rede um centro “espelho” de forma que este seja 
simétrico àquele, com respeito à origem. O centro “espelho” normalmente 
não será um dado medido, mas isso não é problema. 

Uma descrição pictória da escolha simétrica de centros, que facilita a for- 
mação de uma função fmpar, é mostrada na Figura 15.12b. Evidentemente, 
a função em 15.12b ainda não é perfeitamente ímpar, mas normalmente a 
escolha de centros simétricos permite uma sensível melhora na simetria da 
função estática da rede, quando comparado ao caso em que os centros não 
são simétricos. 


Estimação de parâmetros com restrições 


A partir da análise da Figura 15.12, torna-se claro que, para se ter uma 
função estática perfeitamente ímpar, não basta tomar centros simétricos. 
De fato, é ainda necessário que os pesos de dois centros simétricos c; = —c; 
satisfaçam a condição w; = —w;, conforme ilustrado na Figura 15.12c. 

Logo, o problema requer encontrar uma rede da forma (10.10) tal que 
as seguintes condições sejam satisfeitas: 


1. wo=0; 


2. o número de centros Nç seja par. Além disso, Nc/2 centros são esco- 
lhidos por algum critério previamente determinado e os Nç/2 centros 


restantes são escolhidos de forma a serem simétricos aos primeiros. O 
segundo conjunto de centros é chamado de “espelho”; 


3. os Ne +ny + ny pesos do modelo devem ser estimados de tal forma 
que não há restrições sobre os ny + ny pesos da parte linear da rede, 
mas que os Nç pesos das funções de base sejam restringidos aos pares 
a fim de satisfazer w; = —w;, em que i e j indicam os índices de um 
determinado centro e seu espelho, As únicas restrições que atuam 
sobre os pesos são da forma w; = —w;, À menos disso, os pesos da 
rede são parâmetros livres e, juntamente com os ny +ny pesos da parte 
linear, podem ser estimados de forma a minimizar uma determinada 
função custo. 
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(a) 


Figura 15.12: Função estática hipotética de uma rede RBF simples 


Em (a) nenhuma restrição foi utilizada, em (b) os centros foram 
escolhidos de forma simétrica com relação à origem, mas sem res- 
trições impostas aos pesos. Em (c), além de centros simétricos, 
os pesos de cada par de centros simétricos (ci, C;) são restringi- 


dos a satisfazer w; = —w;. À função f (y) só é fmpar no último 
caso. 
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Deve ser notado que, no que tange à simetria da função estática da rede, 
a parte linear (os ny regressores em u e os ny regressores em 4) não tem 
influência. Portanto, procura-se o seguinte modelo 


vk) = Dieta Dre auth- D+ biulk=0)+E0), (1547) 


i=l 


em que o chapéu (”) indica valores estimados e £(k) é o resíduo no instante k. 
Tomando-se (15.47) ao longo de uma janela de dados, tem-se um conjunto de 
N equações que podem ser escritas em forma matricial como (ver Seção 5.3) 
y = Vô +€, em que Ô € IRNe+ryt+nu é 9 vetor de pesos a ser estimado, e a 
matriz de regressores Y € IRNX(Netnytnu) é conhecida. 

À semelhança do que foi feito na Seção 15.3, o conjunto de restri- 
ções, anteriormente mencionado na condição 3, pode ser escrito da seguinte 
maneira: O = Sô, em que O é um vetor de zeros de dimensão Nc/2 e 
S e ZNe/2XNetnytru é uma matriz cujos elementos são O ou 1. Por exem- 
plo, seja a rede RBF composta de Nc = 4 centros, ny = 2 termos auto- 
regressivos e ny = 1 entrada exógena. Nesse caso, o conjunto de restrições 
(ver Exercício 15.6) 


0) [1100000]: 
HORRERÇ E. Sis (15.48) 


que evidentemente está na forma O = sô, implica w = —w2 € wy = —ua. 
Além disso, não há restrições sobre os parâmetros da parte linear da rede. 
Uma função custo frequentemente utilizada é a soma dos quadrados dos 
resíduos, ou seja, &"É. Portanto, a solução do problema de se achar um 
vetor O que minimiza €"€ e satisfaz o conjunto de restrições O = Sô, ou 
seja, a solução do problema 


dos= argmin [67] 
N 15.49 
0:0=50, ( ) 
é dado pelo estimador MQR (5.58), 
Finalmente, deve-se perceber que as restrições dizem respeito aos pesos 
da rede e não aos dados. O conjunto de dados para o treinamento de redes 
com e sem restrições permanece o mesmo. 
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Exemplo 15.4.6. Garantindo simetria em redes RBF 10 


O presente exemplo usa o sistema de Lorenz (1963) 


t=o(y — 2) 
Ú=pz-y-zz (15.50) 
t=2zy - Bz. 


Para o = 10, 8 =8/3 e p= 28, a solução do conjunto de equações 
(15.50) converge para o conhecido atrator caótico de Lorenz, mostrado na 
Figura 15.13, 


Figura 15.13: Atrator de Lorenz 


Reconstrução bi-dimensional do atrator de Lorenz utilizando-se 
a variável x. O atrator é simétrico. 


Se uma janela de dados homogênea for tomada a partir da série tem- 
poral usada para reconstruir a Figura 15.13, a fim de treinar uma rede 
RBF, não é difícil conseguir bons modelos que tenham (aproximadamente) 
as propriedades de simetria do sistema original. Entretanto, se a janela 
de dados utilizada não for homogênea, como, por exemplo, a mostrada na 
Figura 15.14a, torna-se muito difícil obter bons modelos porque uma das 
principais características do sistema — a simetria — não está bem repre- 
sentada nos dados. 

Uma das melhores redes obtidas utilizando-se os dados da Figura 15.14a, 
e sem qualquer tipo de restrição ou cuidado na escolha dos centros, produziu 
os dados da Figura 15.14b. 


"O AGUIRRE et al., 2004. 
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FIGURA 15.14: Atratores de redes identificadas 


Reconstrução bi-dimensional de atratores de redes treinadas a 
partir de (a) um conjunto não-homogêneo de dados do atrator 
de Lorenz; (b) dados de rede treinada sem qualquer tipo de res- 
trição, Nc = 50, de = ny = 5; (c) dados de rede com 30 pares de 
centros simétricos, mas sem restrições nos pesos, de = n=9; 
(d) dados de rede treinada com 40 pares de centros simétricos e 
com restrições nos pesos, de = ny = 6 (AGUIRRE et al., 2004). 


Tomando-se centros simétricos, como discutido acima, e treinando-se 
uma nova família de redes obtiveram-se resultados melhores. Em particular, 
uma das redes com melhor desempenho foi utilizada para simular dados, 
que estão representados na Figura 15,14c, Ainda que a simetria tenha 
melhorado, com respeito ao atrator da Figura 15.14b, o atrator continua 
não-simétrico. 
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Finalmente, tomando-se o mesmo conjunto simétrico de centros, mas 
estimando-se os pesos da rede utilizando o estimador MQR para garantir as 
restrições do tipo w; = —w;, obtêm-se redes que são simétricas por constru- 
ção. O dsempenho de uma dessas redes é mostrado na Figura 15.14d que, 
como esperado, resulta em um atrator simétrico à semelhança do atrator 
original. 

No presente exemplo os centros foram escolhidos utilizando a taxa de 
redução de erro (CHEN et al., 1990). Quando as restrições nos parâmetros 
são utilizadas durante o treinamento, apenas Nc/2 funções de base “livres”. 
Assim, a rede que produziu os dados mostrados na Figura 15.14d, que tem 
80 centros, é equivalente a uma rede com 40 centros sem restrições. No 
presente exemplo, o aumento no tamanho da rede é o preço da simetria. O 


Leitura Recomendada 


O presente capítulo foi fortemente influenciado por recentes trabalhos de 
pesquisa (AGUIRRE et al., 1998b; CORRÊA, 2001; BARROSO, 2001; AMARAL, 
2001; BARROSO et al., 2002; CORRÊA; AGUIRRE, 2004; AGUIRRE et al., 
2004). Recomenda-se a leitura de tais trabalhos para conhecer mais pro- 
fundamente os detalhes. O material apresentado foi organizado de forma 
cronológica, ou seja, as técnicas foram discutidas na mesma sequência com 
que foram desenvolvidas. 

Antes de mencionar alguns trabalhos que tratam de identificação caixa 
cinza, deseja-se mencionar um grupo de trabalhos, que parecem constituir 
uma classe diferenciada. Trata-se de métodos de estimação multi-objetivo 
em que normalmente são utilizados dados (ou informação) em estado esta- 
cionário além de dados oriundos de testes dinâmicos (NEPOMUCENO, 2002; 
NEPOMUCENO ct al., 2003, 2004; BARROSO, 2006; BARROSO et al., 2006). 
Nessa classe de problemas a informação em estado estacionário não é im- 
posta sobre o modelo, no sentido de que este a incorpora ou reproduz exa- 
tamente, mas é apenas utilizada para “influenciar” o modelo positivamente. 
Os fundamentos desses algoritmos foram apresentados na Seção 11.5. 

O uso de conhecimento auxiliar em redes neurais foi tratado em 
(JogRDING; MEADOR, 1991; THOMPSON; KRAMER, 1994; CUBILLOS et 
al., 1994; AMARAL, 2001). Thompson e Kramer advogam em favor da 
utilização de informação auxiliar, principalmente em situações em que os 
dados são compostos por uma série temporal de curta duração e seriamen- 
te contaminada por ruído. O tipo de conhecimento auxiliar utilizado é: 
monotonicidade e assintoticidade; o objetivo da modelagem; restrições “for- 
tes” baseadas em princípios físicos; e, finalmente, o desempenho de modelos 
previamente obtidos. 
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Ainda no contexto de redes neurais, em (JOERDING; MEADOR, 1991) 
são mencionados três benefícios do uso de informação auxiliar em redes 
neurais, a saber: previne que a rede faça predições impossíveis ou não 
plausíveis; melhora a capacidade de generalização e aumenta a eficiência 
do treinamento. Os autores propõem também a utilização de informação 
auxiliar na definição da arquitetura da rede neural e no estabelecimento de 
restrições na estimação dos pesos. 


Bohlin e colegas (BOHLIN, 1994; BOHLIN; GRAEBE, 1995) apresentam 
procedimentos classificados como modelagem semifísica probabilística. 


Na identificação caixa cinza semifísica, conhecimento baseado em leis 
fisicas é usado para sugerir combinações não-lineares entre os sinais medidos 
(LiNDSKOG; LJUNG, 1995). Em (KÁRNY et al., 1995) foi proposto um 
procedimento aplicável a modelos ARX, e em (Lt; PENG, 2006) leis físicas 
foram utilizadas para escolher as funções de ativação de redes neurais. 


Um tipo muito útil de informação auxiliar que frequentemente está dis- 
ponível é a curva estática. Esse tipo de informação auxiliar é que foi usado 
nos Exemplos 15.2.1, 15.3.1 e 15.4.1 no presente capítulo. Um exemplo 
de tal curva para uma turbina de avião é mostrada na Figura 15.15. Em 
(Hsu et al., 2000) encontram-se exemplos da relação estática entre veloci- 
dade de hélice e do empuxo resultante. Outros exemplos são mostrados nas 
Figuras 1.9, 16.20 e 16.22. 


og 150 200 


20 30 350 40 450 
vazão do combustivel (emas) 


Figura 15,15: Curva estática de turbina de avião 


Relação em estado estacionário entre a vazão de combustível e a 
velocidade angular do eixo de uma turbina de avião. As barras 
indicam resultados de medição e a curva é a função ajustada 
(Cras, et al., 2001, copyright IEEE 2001; Criras, 2002). 
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Entre os trabalhos que propõem o uso da curva estática de sistemas 
dinâmicos, destaca-se o apresentado por Pottmann e Pearson (1998) e, 
mais recentemente, (AGUIRRE et al., 2002). O objetivo de modelagem é 
a obtenção de modelos NARMAX polinomiais que reproduzam exatamente 
as características estacionárias conhecidas do sistema. Outros trabalhos que 
utilizam informação auxiliar na seleção de estrutura de modelos podem ser 
vistos em (PETRICK; WiIGDOROWITZ, 1997). Contudo, um ponto essencial 
a observar é que se os dados dinâmicos tiverem suficiente informação de 
baixa fregiiência, é possível a identificação caixa preta de modelos com ca- 
racterísticas estáticas melhores do que modelos obtidos por técnicas caixa 
cinza, conforme foi verificado no contexto de modelos neurais e polinomiais 
em (BARBOSA, 2006). 

Por outro lado, nos Exemplos 15.4.5 e 15.4.6 o tipo de conhecimento 
a priori utilizado foi o fato de o sistema original ser simétrico. Um dos 
desafios na áera de identificação caixa cinza é aprender a reconhecer que 
tipo de informação auxiliar pode ser aproveitada e como fazê-lo. 

Outro alvo buscado na identificação caixa cinza é o uso de informação 
auxiliar na estimação de parâmetros. O objetivo é garantir que o mode- 
lo obtido reproduza o mais fielmente possível características previamente 
conhecidas. Em (BAI; SASTRY, 1986) é considerado o problema de esti- 
mar ganho de uma função de transferência para um sistema SISO. Tulleken 
(1993) discute o problema de uso de informação auxiliar ao estimar parâ- 
metros usando modelos ARMAX e discute a utilização de informação sobre 
estabilidade e ganho estacionário na forma de restrições nos parâmetros. 
Conhecimento auxiliar pode ser incorporado no estimador de parâmetros 
por meio de restrições e penalidades na função objetivo (JOHANSEN, 1996). 
Na última referência, discute-se uma aplicação com modelos NARMAX, 
cuja não-linearidade é implementada usando-se de uma rede neural. Uma 
interessante discussão de identificação caixa cinza no contexto de modelos 
fuzzy pode ser encontrada em (LINDSKOG, 1998). 


Exercícios 


15.1. Derive as restrições (15.13) para o modelo do conversor CO-CC buck. 


15.2. Mostre que as restrições sobre os coeficientes de agrupamentos do 
modelo (15.15), que garantem uma característica estática do tipo (15.16), 
são (15.17). 


15.3. Mostre que o conjunto de restrições da forma c = S6, para o modelo 
(15.22) e a função estática (15.23), pode ser escrita como em (15.24). 


E é 
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15.4, Derive as restrições mostradas em (15.93). 
15.5. Derive a função estática (15.28) da rede (15.27). 


15.6. Discuta a pertinência do conjunto restrições mostradas em (15.48) 
no treinamento de rede RBF para garantir simetria. 


15.7. Descreva procedimentos para a identificação caixa cinza do sistema 
de bombeamento considerado na Seção 1.4. Simulando a Eq. 1.38, levante 
a função estática desse modelo. Em seguida, utilize algum dos métodos 
descritos neste capítulo, por exemplo aquele descrito na Seção 15.3, e os 
dados mostrados na Figura 4.16 (prbsa02 (O) para identificar um modelo 
com a característica estática previamente determinada. 
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Estudos de Caso 


16.1 Introdução 


O presente capítulo apresenta e discute diversos exemplos de aplicação de 
técnicas de identificação e análise de sistemas dinâmicos reais baseados em 
dados observados. Em alguns poucos casos, para efeito de análise e com- 
paração de modelos, foram utilizadas ferramentas de análise de sistemas 
não-lineares que não foram descritas no presente livro. O leitor interessado 
poderá encontrar detalhes sobre tais ferramentas nas referências citadas no 
texto. Todos os exemplos discutidos no presente capítulo são de sistemas 
dinâmicos reais baseados em dados, na sua maioria coletados em laborató- 
rio. Foi uma satisfação e um privilégio contar com a ajuda de tantas pessoas 
que trabalham em áreas tão distintas. A seguir, dá-se crédito a várias delas. 

Os dados usados nas Seções 16.2, 16.4 e 16.6 foram coletados no Labo- 
ratório do grupo MACSIN, sendo que o conversor descrito na Seção 16.4 
foi montado pelos colegas Pedro Donoso, do Laboratório de Eletrônica de 
Potência, e Rúbens Santos Filho. O oscilador descrito na Seção 16.2 foi 
montado por Leonardo Tôrres, e os modelos foram obtidos com a colabo- 
ração de Giovani Rodrigues, Marcelo Corrêa e Ubiratan Freitas. Os dados 
e modelos do sistema térmico descrito na Seção 16.6 foram obtidos com a 
colaboração de Cecília Cassini, 

Os dados das Seções 16.3, 16,5 e 16.9 foram coletados por pessoas do 
grupo MACSIN, no Laboratório de Controle de Processos Industriais dos 
colegas Fábio Jota e Ronaldo Pena, e na Usina Piloto de Concentração de 
Minérios coordenado pelo Dr, José Aury de Aquino e pela Dra. Maria Lúcia 
de Oliveira. Em particular, Cristiano Jácome trabalhou com os dados de 
uma válvula pneumática (Seção 16.5), e Eduardo Saraiva estudou a iden- 
tificação multivariável de uma planta piloto de flotação em coluna, como 
descrito na Seção 16.9. 
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Os dados de um paciente com distúrbios respiratórios, estudados na Se- 
ção 16.7, foram disponibilizados por RIGNEY e colegas (1994) na Internet. 
Os dados descritos na Seção 16.8 são sinais cardiovasculares de animais e 
foram coletados no Laboratório de Hipertensão, coordenado pelo professor 
Robson Santos, pelo colega Homero Guimarães e pré-processados e anali- 
sados por ele e o colega Murilo Gomes e posteriormente por Dair Oliveira. 
Os dados da Seção 16.10 foram obtidos e ajustados por Antonio Aguirre, 
professor do Departamento de Economia da UFMG. 


Os dados descritos na Seção 16.11 foram obtidos por Pedro de Oliveira 
e pelo colega Paulo Seixas do Laboratório de Eletrônica de Potência. Os 
dados da Seção 16.12 foram obtidos por Guilherme Pereira e pelo colega 
Mário Campos do Laboratório de Visão Computacional e Robótica.! 


Os dados usados na Seção 16.13 foram coletados pelo colega Hani Yehia 
na ATR (Japão) e estudados por Glauco Yared. Finalmente, os dados 
usados na Seção 16.14 foram disponibilizados por Júlio Ragone e Sanderson 
Abreu da Companhia Força e Luz Cataguazes Leopoldina e estudados em 
cooperação com Daniela Rodrigues e Sílvio Lima. 


Outros sistemas reais foram estudados ao longo do livro. Na Seção 1.4 foi 
feita a modelagem pela física do processo de um sistema de bombeamento 
do Laboratório de Hidráulica da UFMG, coordenado pelo colega Carlos 
Martinez. Os dados coletados nesse sistema, com a colaboração de Rodolfo 
Santana e Francisco Magalhães, foram modelados e analisados usando-se 
ferramentas de identificação de sistemas no Exemplo 3.6.2. 


Os dados do separador magnético operando em malha fechada, descri- 
tos no Exemplo 3.4.1, foram coletados pelo Engenheiro Miroslav Bires, da 
Companhia Vale do Rio Doce. 


Os dados da malha de controle de combustão descritos no Exem- 
plo 3.3.1 foram coletados com o Engenheiro Ricardo Nicolini, na Central 
Termoelétrica da Açominas, sob a direção do Engenheiro Cláudio Moreira 
Lima. Esse sistema foi estudado e modelado juntamente com o colega 
Ronaldo Pena, 


Antes de passar aos casos estudados, o leitor é lembrado de que ao 
longo do livro convencionou-se apresentar os regressores escolhidos usando- 
se o critério ERR (ver Seção 11.3) na mesma ordem de importância definida 
por tal critério, 


1Q laboratório do grupo MACSIN e os laboratórios de Eletrônica de Potência e de 
Controle de Processos Industriais são do Departamento de Engenharia Eletrônica da 
UFMG. O Laboratório de Visão Computacional e Robótica e o Laboratório de Hiper- 
tensão pertencem, respectivamente, ao Departamento de Ciência da Computação e 
ao Departamento de Fisiologia e Biofísica da UFMG. A usina piloto de concentração 
de minérios pertence ao Centro de Desenvolvimento de Tecnologia Nuclear - CDTN. 
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16.2 Oscilador Eletrônico Caótico 
16.2.1 O circuito de Chua 


O circuito de Chua é um dos sistemas mais utilizados na atualidade como 
paradigma para o estudo de dinâmica não-linear e caos. O circuito em si 
está mostrado na Figura 16.1a e é composto de componentes lineares, à 
exceção do diodo de Chua, que é um dipolo com a característica linear por 
partes mostrada na Figura 16.1b. Tal componente tem resistência negativa 
e é o elemento que confere energia ao sistema permitindo, assim, manter o 
circuito oscilando autonomamente, 


(a) (b) 


FIGURA 16.1: O circuito de Chua 


(a) o circuito de Chua e (b) característica corrente-tensão medida 
para o diodo de Chua implementado. 


Portanto, no circuito de Chua, a não-linearidade é devida à presença 
do diodo de Chua, que na prática pode ser implementado utilizando-se 


amplificadores operacionais e outros componentes simples. As equações 
que descrevem o circuito são 


dvcy ds (vc = vai) 


O Ti “RW ia(vai) 
dv (va-vo),; 
Sire Ss pe 
di 
JS —“m (16,1) 


sendo que vc, é a tensão sobre o capacitor Cj, iz, é a corrente no indutor e 
a corrente que passa pelo diodo de Chua é 


| 
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move, + Bp(mo — ma) vc <-Bp 

ia(vc) = 4 mava para [vc |<SBp (16.2) 
mova, + Bp(ma — mo) vo, > +Bp. 


O seguinte conjunto de parâmetros pode ser utilizado para simular o cir- 
cuito de forma a se aproximar do protótipo que foi montado: C1=10,0nF, 
C=100nF, L=19,2mH e R é um trimpot de 2,0k9. O diodo de Chua foi 
montado usando-se dois amplificadores operacionais, conforme sugerido em 
(KENNEDY, 1992), tendo sido medidos os seguintes valores para os parâme- 
tros: mo = —0,37 + 0,04mS, my = —0,68 + 0,04mS e Bp =1,1+0,2V. 

Variando-se o trimpot R, o circuito apresenta diversos regimes dinâmi- 
cos, tais como pontos fixos estáveis, oscilações periódicas e dinâmica caótica. 
Dois exemplos de regimes dinâmicos caóticos são mostrados nas Figuras 16.2 
e 16.3. Essas figuras mostram os dados imersos no plano de fase. Tal re- 
curso é muito útil para a análise de sinais caóticos, uma vez que a variável 
tempo não é representada no plano de fase. Nesse plano, a ênfase é a re- 
presentação dos diversos padrões dinâmicos envolvidos. Padrões diferentes 
normalmente resultam em atratores com geometria diferente. 


-4 
-4 


FIGURA 16.2: Atrator dupla-volta 


Atrator dupla-volta (dsvci (O), obtido para R = 1.800 1), recons- 
truído a partir de 1.500 observações da tensão sobre o capacitor 
C1 do circuito de Chua. As unidades dos eixos são volts. 
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16.2.2 Identificação monovariável 


Esta seção descreve a identificação de regimes dinâmicos do circuito de Chua 
a partir de medições. Deve ser notado que a identificação será feita a partir 
de apenas uma variável, ou seja, os modelos resultantes serão autônomos. 
Uma consegiiência disso é que os modelos devem ser interpretados como 
modelos de regimes dinâmicos específicos e não do sistema de forma global, 
como ocorre no caso de os modelos serem não autônomos. 


FIGURA 16.3: Atrator espiral 


Atrator espiral (spvct (0), obtido para R x 1.900 9), reconstruído 
a partir de 1.500 observações da tensão sobre o capacitor Cy do 
circuito de Chua. As unidades dos eixos são volts. 


Modelos polinomiais NARMAX 


A identificação e análise dos dados mostrados nas Figuras 16.2 e 16.3 foi 
estudada e documentada em detalhes nos trabalhos (RODRIGUES, 1996; 
AGUIRRE et al. 1997). No caso dos dados da Figura 16.2, a tensão sobre 
o capacitor C1 foi amostrada em intervalos de 12 us, resultando numa série 
temporal de 5.000 pontos, sendo usada apenas uma janela de 1.000 obser- 
vações para obter o seguinte modelo: 
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u(k) = 35232(k-1) —4,2897z(k-2) —0,25887(k—4) — 1,7784z(k—1)? 
+2,0652 «(k—3) + 6,1761 x(k—1)2x(k—2) 
+0,1623 2(k— 1)e(k=2)z(k—4)—2,7381 z(k— 1)22(k—3) 
—5,5309 e(k— 1)x(k—2)2+0,1031 z(k— 2)? 
+0,4623 2(k—4)3—0,5247 2(k—2)2x(k—4) | 
-1,8965 2(k— 1)z(k=3)2+5,4255 2(k— 1)z(k— 2)2(k—3) 
+0,7258 e(k—2)x(k—4)2-1,7684 2(k—3)x(k— 4)? 
+1,18002(k—3)2x(k—4) + VE(k — 1)06 + E(k), (16.3) 


sendo que WE(k— 1)ôg é a parte MA (média móvel) do modelo que, conforme 
visto no Capítulo 7, é incluída a fim de minimizar o efeito de polarização do 
estimador. Chama-se a atenção para o fato de que os modelos apresentados 
na presente seção usarão a variável z(k) em vez de y(k) apenas para indicar 
que tais modelos foram identificados a partir de observações da variável z 
do circuito, correspondente a vc; (t). A nomenclatura de agrupamento de 
termos continuará a usar y. 


ve th) 


FIGURA 16.4: Atrator dupla-volta de modelo identificado | 


Atrator dupla-volta obtido simulando-se o modelo (16.3) identifi- 
cado a partir dos dados da Figura 16.2. As unidades dos eixos são 
volts. 


d 
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Semelhantemente, o modelo 


a(k) = +0,23382x 102(k—1)-0,26888x 10z(k—2)+0,18154x 10z(k-3) 
—0,50374 2(k— 4) —0,17498x(k— 5) -0,37064 
-0,191052(k—1)e(k=5)+0,25216x 10! z(k= 1)z(k-3)x(k=5) 
—0,30255 x 10! z(k— 1)z(k—4)z(k—4)+0,168567(k—2)z(k—3) 
-0,402x 10!z(k-1)x(k—1)-0,314x 10 z(k= 1)a(k= 1)x(k=5) 
+0,27849x 102 (k-2)u(k=-2)z(k—3) + VE(k— 1)06 + E(k) 

(16.4) 


foi identificado a partir dos dados mostrados na Figura 16.3, que foram 
amostrados com periodicidade igual a 20 ss. Comparando-se as Figuras 16.2 
e 16.3 com 16.4 e 16.5, respectivamente, percebe-se que os modelos (16.3) 
e (16.4) parecem ter capturado o comportamento dinâmico dos respectivos 
atratores. 


E) 
Ve th) 


FIGURA 16.5: Atrator espiral de modelo identificado 


Atrator espiral obtido simulando-se o modelo (16.4) identificado a 
partir dos dados da Figura 16.3, As unidades dos eixos são volts. 


A representação no plano de fase nada mais é do que uma forma de apre- 
sentar os dados sem o uso explícito da variável tempo. Contudo, deve estar 
claro ao leitor que as Figuras 16.2 e 16.4, por exemplo, representam sinais 
temporais. Trechos dos respectivos sinais estão mostrados na Figura 16.6 
e percebe-se que comparar séries temporais medidas e simuladas torna a 
validação mais difícil nos casos em que o sistema em estudo é sensível às 
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condições iniciais, como é o caso de sistemas com dinâmica caótica. No 
Complemento 13.1 foi apresentada uma discussão preliminar sobre como 
representar uma série temporal no plano de fase, ou seja, como fazer uma 
imersão. 


ta) 


4 [> > —>— 
Il 
E 
go 

-2 

- 

0 100 200 300 00 500 7) 700 

o 

4 

1 
£o 

-2 

“o 100 200 300 409 [7] [7] 

número de observações o 


FIGURA 16.6: Séries temporais do atrator dupla-volta 


Séries temporais do atrator dupla-volta obtidas a partir (a) dos 
dados da Figura 16.2 e (b) da simulação do modelo identificado 
(16.3). Note como, devido ao fato das oscilações serem caóticas, 
a comparação das séries temporais torna-se mais difícil. 


Como pode ser visto na Tabela 16.1, o modelo do atrator de dupla- 
volta não tem os agrupamentos Mg e ya (cujos coeficientes são Do e Ly), 
em função da simetria de pontos fixos, conforme discutido nas Seções 10.5 
e 10.6. 


TABELA 16.1: Coeficientes de agrupamentos de modelos identificados. 


—7,8620x 107 
—0,00859 


Outro aspecto que pode ser verificado nos modelos identificados é a 
localização de seus pontos fixos. Assim, usando as definições da Seção 10.6 
chega-se aos resultados mostrados na Tabela 16.2. 

Como os modelos são identificados a partir de apenas uma variável, 
no melhor dos casos é possível representar (do ponto fixo no modelo) a 
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coordenada correspondente à variável usada. Ou seja, se vc, é a variável 
observada, então espera-se que o modelo tenha um ponto fixo perto de 
1,88V (e não 15,6mV ou -1,04mA). De fato, o modelo (16.3) tem um ponto 
fixo em 2,24V. No caso do modelo (16.4), percebe-se que há dois pontos 
fixos complexos conjugados. Em se tratando de dados reais, esse resultado, 
apesar de não ser crítico, não é o mais desejável. Deve ser notado que o 
ponto fixo em -2,24 V é aproximado pelo modelo (16.4) em -3,72 V. Observe- 
se que os dados sobre o atrator espiral não visitam as vizinhanças dos três 
pontos fixos do sistema. Consegiientemente, os dois pontos fixos dos quais 
não há informação nos dados são aproximados pelo modelo por um par de 
pontos fixos complexos conjugados. 


TABELA 16.2: Pontos fixos de modelos identificados. 


Localização de pontos fixos 

( 1,88V, 15,6mV, -1,04mA ) 
(224V,0V,-224V ) 
(-224V, 17,55mV, -LITmA ) 

(-3,72V, -1,79+92,9V, -1,79-92,9V ) 


Sistema 
Dupla-volta 
Eq. 16.3 
Espiral 

Eq. 16.4 


A partir da Tabela 16.1 e dos resultados das Seções 10.5 e 10.6 é possível 
justificar o fato de o modelo (16.4) ter pontos fixos complexos e também 
é possível sugerir alterações na estrutura do modelo no sentido de contor- 
nar o problema (ver Exercício 16.1). Discussão relevante ao problema de 
pontos fixos pode ser encontrada em (AGUIRRE; MENDES, 1996; MENDES; 
BILLINGS, 1998). 


Modelos racionais NARMAX 


À semelhança do que foi feito para a representação polinomial NARMAX, 
os dados usados na seção anterior foram utilizados para identificar modelos 
racionais NARMAX (ver Seção 10,4), usando-se o algoritmo descrito na 
Seção 11.4. Um modelo identificado foi (CORRÊA, 1997) 


uk) = 1» (BHOOBU(R-1)-1,7594y(k-2)+0,2000p(k=5)+0,6192y(k 1] 


—1,0219y(k—2)º-3,2455 y(k— 1)y(k—5)+0,0735 y(k— 3)? 
+0,3444 y(k— 1)y(k— 5)2—0,4401 y(k— 2)y(k— 5)? 
+3,4624y(k = Dy(k—2)y(k— 5) +0,1986 y(k— 1)2y(k—2)) 


10 5 
+ delk =) +53 dse(k — 52 + E(h), (16.5) 


ist j=1 
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sendo 


D = 1+1,5164y(k-1)y(k—2)+,5657y(k—3)y(k—5)—12,8527y(k— 2)? 
+0,1948y(k—1)2+1,7662 y(k—2)y(k— 5) —0,1409 y(k— 5)? 
—2,0470y(k—1)y(k 5). (16.6) 


Simulando-se o modelo mostrado nas Eq. 16.5 e 16.6 resulta em oscila- 
ções caóticas, tomando-se como condições iniciais valores do conjunto de 
dados usados para a identificação. Representando-se os dados simulados 
no plano de fase (ver Complemento 13.1), resulta na projeção do atrator 
mostrada na Figura 16.7. 

Os pontos fixos do modelo racional mostrado nas Eq. 16.5 e 16.6 estão 
em zero e +2,37. Comparando-se o desempenho do modelo racional mos- 
trado anteriormente com o modelo polinomial (16.3), observa-se que este é 
superior em alguns aspectos. 


a— — 1 > 1 O 1 —1— 


a+ 


Vei(k-4) 
o 


er = -2 Er) 


FIGURA 16.7: Atrator dupla-volta de modelo racional 


Atrator dupla-volta obtido simulando-se o modelo mostrado nas 
Eqs. 16.5 e 16.6 identificado a partir dos dados da Figura 16.2. As 
unidades dos eixos são volts (CORRÊA, 1997). 


Modelos polinomiais contínuos 


Modelos contínuos como os descritos na Seção 10.2.4 foram obtidos a partir 
de observações medidas a uma taxa de 300 Hz da tensão vc,. É importante 
mencionar que a implementação do circuito usada na presente seção dife- 
re da implementação descrita anteriormente, uma vez que agora utilizou-se 
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um circuito do tipo gyrator no lugar do indutor (TÔRRES; AGUIRRE, 2000; 
Torres, 2001; TÔRRES; AGUIRRE, 2005). É possível implementar in- 
dutores ativos que correspondem a indutores com elevada indutância. A 
consegiiência prática é a possibilidade de se ter oscilações muito mais len- 
tas, o que permite, por sua vez, trabalhar com taxas de amostragem mais 
baixas. No presente caso, o tempo de amostragem T; = 1/300s correspon- 
de aproximadamente a 100 observações por pseudoperíodo, resultando no 
atrator mostrado na Figura 16.8a. 


(a) 


Figura 16.8: Atrator dupla-volta de modelo contínuo 


Atrator dupla-volta (a) dados medidos, sendo X = voi(t) e 
Y = vei (t) (b) obtido simulando-se o modelo contínuo. 
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Os dados obtidos dessa maneira foram utilizados na identificação. As de- 
rivadas do sinal foram estimadas seguindo-se um procedimento semelhante 
ao descrito no Complemento 10.2. O número de centros, ou seja, o número 
de restrições utilizadas para estimar os parâmetros foi de 900. Estes foram 
escolhidos igualmente espaçados ao longo de uma janela de 9.000 observa- 
ções. Um modelo de 29 termos foi obtido com o auxílio do algoritmo de 
ERR, descrito na Seção 11.3. A projeção do atrator obtido por simulação 
do modelo contínuo identificado é mostrada na Figura 16.8b, juntamente 
com os dados originais para comparação. 

À primeira vista, as projeções dos atratores parecem muito próximas. A 
Figura 16.9, por sua vez, mostra os mapas de primeiro retorno do oscilador 
real e do modelo. A partir dessa figura, observam-se algumas divergên- 
cias nos referidos mapas, o que indica pequenas diferenças na dinâmica 
não-linear do modelo em relação ao sistema. Deve ser notado que as variá- 
veis usadas na determinação dos mapas de primeiro retorno são distintas, 
e consegiientemente as escalas. Entretanto, as características qualitativas 
geométricas são as mesmas independente da variável usada. 


(a) (b) 


7045 
* 


FIGURA 16.9: Mapa de primeiro retorno de modelo contínuo 


Mapa de primeiro retorno do atrator dupla-volta (a) obtido a par- 
tir de dados medidos e (b) obtido simulando-se o modelo contínuo 
identificado (AGUIRRE et al., 20002). 


16.2.3 Identificação multivariável 


Nesta seção serão mostrados modelos polinomias discretos e contínuos. Em 
ambos os casos, as três variáveis de estado do circuito de Chua foram 


da 
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observadas e usadas no processo de identificação. Os resultados são mo- 
delos multivariáveis que têm uma equação para determinar cada variável 
de estado. Em alguns casos os coeficientes dos modelos serão apresentados 
com várias casas decimais para permitir a simulação dos modelos o mais 
próximo possível dos resultados apresentados abaixo. Portanto, tais coe- 
ficientes não devem ser interpretados como tendo todas as casas decimais 
estatisticamente significativas. 


Modelos polinomiais NARMAX 


O seguinte modelo foi obtido a partir de 1.000 observações em cada variável 
de estado do circuito de Chua: 


r(k) = 1,41849527(k-1) + 3,2374889x 10?z(k—1) + 0,98067833y(k— 1) 
—4,7499981 x 10"2x(k— 1)º — 2,7300719x 10º=(k— 1)y(k— 1)? 
—34,3453662(k— 1)z(k— 1)2+6,4982704x 10!y(k— 1)2(k— 1)2, 


v(k) = 0,73801292y(k—1)—9,7476131x 10ºz(k—1)º + 0,19289163x/(k— 1) 
+2,5991648 x 1022(k— 1) 1,7734303 x 10"2z(k— 1)º 
—4,43949257(k—1)y(k—1)z(k—1)—7,284094z(k = 1) y(k— 12, 

=k) = 0,832519682(k—1) —9,6925468x 10-*y(k—1) 


—1,2168819x 10"“z(k—1)+1,7476943x 10"*=(k— 1)º, (16.7) 


Para gerar o conjunto de termos candidatos, o grau de não-linearidade 
escolhido foi igual a 3, e o maior atraso nas variáveis de estado também 
igual a 3. O algoritmo ERR, descrito na Seção 11.3, foi usado para escolher 
entre os regressores candidatos. É interessante notar que o máximo atraso 
escolhido por esse critério é igual a um. À razão para isso é que o número 
de equações do modelo é igual à ordem dinâmica do sistema, ou seja, três. 
O número de termos por equação foi escolhido por simulação dos modelos 
obtidos. Além dos termos de processo indicados no modelo (16.7), foram 
usados dez termos de resíduo, de cada variável, em cada equação para re- 
duzir o efeito de polarização com o estimador EMQ. A Figura 16.10 mostra 
o atrator obtido por simulação do modelo identificado (16.7). 


Modelos polinomiais contínuos 


Nesta seção foram usadas as três variáveis de estado do sistema em estudo, 
a saber, vc, VC, € iL, observadas a uma taxa de 300Hz. A Figura 16.11a 
mostra o atrator, onde a presença de ruído de medição pode ser percebida. 

Trechos de 3.000 observações de cada variável foram filtrados usando- 
se um filtro Butterworth, passa-baixa de quarta ordem, com fregiiência 
de corte em 18,3 Hz (FREITAS; AGUIRRE, 1999; FREITAS, 2001). O atrator 
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após a filtragem dos dados é mostrado na Figura 16.11b. As derivadas foram 
determinadas conforme descrito no Complemento 10.2, usando-se janelas de 
cinco pontos. 

Para a identificação propriamente dita, foram escolhidos 1.300 centros, 
igualmente espaçados ao longo das 3.000 observações. O grau de não- 
linearidade máximo foi igual a três. Um dos modelos assim obtido é 


vo, = 43,000,-7,48x10%7 +12,9vc, —2,58 06, +3,38x 1077 vcs, 
vc = 371x10%iZ vc, +11l,2vc, +3,74 x 10!iz — 7,1800,, (16.8) 
ir = -2,00x10"vc, + 8,31 x 10%i2 vc, — 5,12 x 10-4vc,. 


v, 


ct 


FIGURA 16.10: Atrator dupla-volta simulado 


Foi usado o modelo não-linear multivariável discreto (16.10). Cla- 
ramente, o referido modelo consegue reproduzir as oscilações caó- 
ticas no formato de dupla-volta, como o circuito original. 


As Egs. 16.8 foram integradas partindo-se das mesmas condições iniciais 


dos dados de identificação, gerando um conjunto de 10! pontos. O atrator 
desse modelo é mostrado na Figura 16.12. 
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vem vem 


FIGURA 16.11: Atrator dupla-volta medido e filtrado 


(a) atrator dupla-volta medido usando-se uma implementação real 
do circuito de Chua. (b) dados filtrados com filtro de Butterworth 
de quarta ordem. Os eixos correspondem às variáveis de estado 


do circuito. 


Vet (V) 


FIGURA 16.12; Atrator dupla-volta simulado 
Atrator dupla-volta simulado usando-se o modelo (16.8). 
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16.3 Um Pequeno Aquecedor Elétrico 


O processo considerado nesta seção consiste de uma caixa metálica com uma 
resistência elétrica no seu interior. A temperatura da superfície da caixa é 
medida e informada a um microcomputador, onde é feito o controle digital 
da temperatura. O atuador é uma chave semicondutora (ABREU, 1993). 

Os dados são mostrados na Figura 16.13. A fim de coletar os dados de 
identificação, ligou-se o sistema operando em malha fechada. Isso pode ser 
visto nos primeiros instantes dos testes mostrados na Figura 16.13, onde a 
temperatura da superfície da caixa está abaixo da temperatura ambiente, 
e o controlador comanda 100% de ação de controle. À medida que a tem- 
peratura chega ao valor especificado, 60%, o controlador diminui a ação de 
controle a fim de regular a temperatura nesse valor. 


(a) 
T 


TE 


tmin) 


- FIGURA 16.13: Dados de testes num forno 
Dados resultantes de testes efetuados num aquecedor elétrico em 
dias diferentes. Traços pontilhados representam o sinal de entra- 
da (determina potência elétrica entregue) e o traço contínuo O 
sinal de saída, a temperatura. (a) dados usados para identifica- 
ção (£0407 (0), e (b) dados usados para validação (£0307 O). 


Após 30 minutos, o processo está em estado estacionário e o teste dinã- 
mico efetivamente começa. A primeira providência é colocar o controlador 
em manual, ou seja, a malha de controle é aberta. Em segundo lugar, 
projeta-se um sinal de entrada com características aleatórias. A forma com 
que os valores dos diversos patamares é escolhida não é crítica, desde que 
o sinal resultante tenha características aleatórias. Por outro lado, um fator 
importante é a duração de cada patamar. Deve-se tomar cuidado a fim de 


| 
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que o sinal resultante não seja rápido demais. Um critério simples e que 
normalmente atende à maioria dos casos é garantir que cada patamar do 
sinal de entrada seja amostrado em torno de três vezes. No caso estudado 
na Seção 16.9, a escolha dos sinais de entrada, que inclui a duração dos 
referidos patamares, é discutida com maiores detalhes. 

A partir dos dados de entrada e saída mostrados na Figura 16.13a foram 
identificados os seguintes modelos polinomial e racional (RODRIGUES, 1996; 
Corrêa, 1997), respectivamente: 


vlk) = 044551 y(k — 1) + 0,57773 y(k — 2) — 0,63628u(k — 2) 
+0,4860 u(k — 1) — 1,14580x 107º y(k — 1)2u(k — 1) 
—9,97760x 1075 u(k — 1)2u(k — 3) — 2,92710x 1055 y(k — 3)3 
+7,88310x 1073 y(k — 2)u(k — 2) 
+7,43860 x 1078 y(k — 3)2u(k — 3) 

(16.9) 


4) = DS122u(k=1)+0,0186u(k-1)- 0,6029x10-2y(k- 1u(k—1) 
ví 1-0,4937 x 10-Ju(k — 1) 
(16.10) 


A simulação do modelo polinomial (16.9) foi discutida na Seção 13.2. Em 
particular, o desempenho desse modelo na predição dos dados mostrados na 
Figura 16.13b foi mostrado na Figura 13.2a. Por outro lado, o desempenho 
do modelo racional (16.10) usando-se os mesmos dados pode ser visto na 
Figura 16.14. 

Um ponto interessante ao se trabalhar com modelos não-lineares é obter- 
se a relação estática não-linear e verificar se é possível fazê-lo de forma 
analítica. Esse assunto foi tratado no Complemento 10.5 para o caso de 
modelos polinomiais NARX, e será ilustrado novamente nas Seções 16.4, 
16.5 e 16.6. As funções não-lineares estáticas dos modelos (16.9) e (16.10) 
podem ser obtidas analiticamente como se segue. Agrupando os termos do 
modelo (16.9) conforme detalhado na Seção 10.5, tem-se 


7 =Dyj + Dui+Eguli+ ya + Dag" + Dust, (16.11) 
de onde se obtém o polinômio de terceiro grau em j 


0 = —2,92710 x 107573 — 1,07141 x 10-809?+ 
(0,02324 + 7,88310 x 10-31) 5 — 0,15028ã — 9,97760 x 10-53. 


(16.12) 
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Figura 16,14; Simulação de modelo racional 
Desempenho do modelo (16.10) na simulação livre dos dados 


de validação (10307 0). Resultados análogos para o modelo 
polinomial (16.9) podem ser vistos na Figura 13.2n. 


Evidentemente, (16.12) tem três pontos fixos, mas apenas um deles é 
estável para toda a faixa de valores da entrada O S à S 40. Dividindo-se o 
ponto fixo estável pelo valor correspondente da entrada, resulta no ganho do 
modelo, Essa função é mostrada na Figura 16.154. A razão pela qual não 
foi possível obter-se uma expressão analítica para o ganho do modelo (16.9) 
é porque ele não satisfaz as condições discutidas no Complemento 10.5. Por 
outro lado, o modelo racional (16.10) satisfaz a tais condições, e a seguinte 
expressão pode ser obtida analiticamente para o ganho do modelo: 
Do 0,6185 
u 00878 +5,5353 x 10-35" 

A função (16.13) é mostrada na Figura 16.15b. Conforme visto, o for- 
mato global das funções não-lineares estáticas dos modelos (16.9) e (16.10) 
são bastante próximas para a faixa de valores de entrada 10 < u < 45 e, 
por sua vez, tais funções são parecidas com a característica medida dire- 
tamente no aquecedor. Na Figura 16.15 as funções de ganho dos modelos 
foram avaliadas extrapolando-se a faixa de valores de u correspondente ao 
dados de identificação, que é 20 < q < 40, como pode ser constatado na 
Figura 16.13a. Neste particular, nota-se que se tais funções forem extrapo- 
ladas ainda mais, ou seja, abaixo de i = 10 e acima de d = 45, a função de 
ganho do modelo racional aproxima melhor a função de ganho medida do 
que a do modelo polinomial medida dois anos antes (ABREU, 1993). 


k(a) = (16.13) 


4 
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- 


pa 
"So 15 20 25 E 35 0 45 
bar(u) 


FiGURA 16.15: Ganho de modelos polinomial e racional 
Ganho em função do valor estático da entrada ii, dos modelos 


(a) polinomial e (b) racional. No caso do modelo racional (16.10), 
é possível obter a função de ganho (16.13) analiticamente, 


16.4 Um Conversor CO-CC Buck 


Esta seção descreve a identificação de um conversor estático CC-CC do tipo 
buck, como mostrado na Figura 16.16. Além de aplicar técnicas de identifi- 
cação, será visto como a estrutura do modelo influi criticamente na capaci- 
dade do modelo de representar características estáticas do conversor. Tam- 
bém será constatado que fregiientemente uma melhora nas características 
estáticas do modelo resulta em redução na exatidão como que o modelo se 
ajusta a dados de validação. 


16.41 O conversor buck 


O sistema de regulação de tensão de carga não é mostrado na Figura 16.16. 
Durante os testes, a serem descritos a seguir, a fonte CC de alimentação, 
va, foi mantida constante e igual a 24V. O MOSFET IRF840 é chaveado 
atuando-se na porta G. A razão cíclica é definida como a proporção de 
tempo em que a chave está ligada em relação ao período de operação, T, 
ou seja, D = Thgado/T. À razão cíclica foi variada usando-se técnicas de 
modulação por largura de pulso (PWM) a uma taxa de 1/T = 33kHz, via 
O circuito integrado LM3524. 
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« [ Irreso 


FIGURA 16.16: Conversor estático buck 


Atuando-se na porta (G) da chave semicondutora, obtém-se uma 
tensão contínua de saída, vo, à partir de uma fonte de tensão 
contínua, constante, vg. 


O valor da fregiiência 1/T = 33kHz resultou em modo de operação 
contínua, ou seja, a corrente no indutor nunca se anulava. Quando a razão 
cíclica está perto da unidade, a corrente através do indutor e a tensão na 
carga, vo, aumentam, pois a fonte vg energiza a malha formada por ela, o 
capacitor e o indutor. Por outro lado, quando D = 0, a tensão de saída, 
vo, diminui segundo um regime dinâmico diferente, evidenciando, assim, 
aspectos não-lineares do conversor. 


16.4.2 Testes e aquisição de dados 


A fim de excitar a dinâmica do conversor, optou-se por um sinal de entrada 
do tipo PRBS, conforme descrito na Seção 4.3. Portanto, um sinal PRBS 
com as características descritas a seguir foi gerado em um microcomputador 
e aplicado ao buck usando-se um conversor D/A. Durante os testes, a tensão 
de saída do conversor buck foi considerada a variável de saída, ao passo que 
a entrada é o valor CC usado para gerar o sinal PWM que comanda a porta 
G do MOSFET. 

Testes preliminares, que consistiram basicamente de respostas ao de- 
grau, mostraram que o conversor tem uma constante de tempo dominante 
de aproximadamente 2 milisegundos. Por outro lado, o tempo de amos- 
tragem escolhido foi T; = 10us. Evidentemente, tal valor é menor do que 
o necessário, mas preferiu-se superamostrar os dados de maneira a poder 
testar diferentes fatores de decimação e, consegientemente, diferentes taxas 
de amostragem efetiva. 

A fim de projetar o sinal binário pseudo-aleatório (PRBS), dois parâme- 
tros precisam ser escolhidos: o número de bits, n, e o tempo mínimo entre 
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chaveamento, Th. Tais parâmetros foram definidos na Seção 4.3, onde tam- 
bém foram discutidas maneiras de determiná-los. O mínimo número de bits 
deve ser tal de maneira a garantir que o período do sinal pseudo-aleatório 
seja maior do que o tempo de acomodação do sistema, ou seja, 


2 x To > 5 x 2 milisegundos, (16.14) 


sendo que foi considerado que o tempo de acomodação é igual a cinco vezes 
a constante de tempo dominante. Por outro lado, Th pode ser escolhido 
usando-se a relação (4.20). Tal equação garante que cada valor do sinal de 
entrada permanecerá constante por um período de tempo mínimo que varia 
de õ a 3 da constante de tempo do sistema. No presente caso, usou-se o 
limite superior, o que resultou em Tb = 67041. Usando-se esse valor na 
Eq. 16.14, chega-se à conclusão de que são necessários 8 bits para gerar um 
sinal pseudo-aleatório com as características desejadas. O resultado de um 
teste, conforme descrito acima, pode ser visto na Figura 1.13. 

Como descrito acima, os dados foram amostrados a uma taxa mais alta 
do que o necessário. Seguindo-se o procedimento descrito na Seção 12.2.3, 
escolheu-se o fator de decimação À = 12, o que resultou num tempo de 
amostragem de trabalho igual a Tg = 120's. Evidentemente, outras taxas 
de decimação próximas poderiam ser utilizadas (ver Exercício 16.2). 


16.4.3 Identificação de modelos 


A fim de se obter modelos para o conversor buck, a primeira metade das 
séries temporais mostradas na Figura 1.13 foi utilizada para identificação e 
a segunda metade para a validação. 

Após decimar os dados da Figura 1.13, obteve-se um conjunto de dados 
de 166 observações, sendo que as primeiras 83 foram usadas para identi- 
ficação e a segunda metade para validação. No início, seguiu-se um pro- 
cedimento do tipo “caixa preta”, ou seja, gerou-se um conjunto de termos 
candidatos e utilizou-se o critério ERR descrito na Seção 11.3 para auto- 
maticamente selecionar os regressores. Assim, os melhores modelos linear, 
linear mais constante e não-linear foram 


uk) = 1,7649y(k-1)-0,8027y(k—2) + 0,8661u(k—3)—0,73578u(k—1) 
+7,5129x10u(k—2) + Ve(k—1)06 + E(k), (16.15) 


vlk) = 1,4628y(k-1)-6,8343x 10-!y(k—2) + 6,6153-1,8636u(k— 1) 
+2,5723x 10*y(k—3) + 2,9910x 10-u(k— 3) 
+Ve(k=1)d; + E(R) (16.16) 
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v(k) = 1101y(k-1)-3,5707y(k—2) + 5,5123x 10?y(k— 1)? 
—2,6830u(k—1)2-9,8706x 10"2y(k— 1)y(k—3) 
+9,2757x 102y(k—2)y(k—3) —8,1247x10-4y(k—3)u(k— 1) 
+27,032 + 0,78813 y(k—2)u(k— 1) + Ve(k—1)06 + E(k), 
(16.17) 


sendo que £(k) são os resíduos e y(k) é a tensão de saída vo. Como em casos 
anteriores, a parte MA dos modelos não será usada nas simulações. 

A simulação dos modelos (16.15)-(16.17) é mostrada nas Figuras 16.17a, 
16.17b e 16.18a, respectivamente, para efeito de sua validação. 

O modelo linear tem visíveis dificuldades em acompanhar os dados me- 
didos, ao passo que o modelo (16.16) tem um desempenho superior. Mas, 
evidentemente, o modelo não-linear é o que melhor acompanha a tensão 
observada. Além disso, o modelo (16.17) foi validado utilizando-se um 
conjunto de dados totalmente distinto com ótimo desempenho, conforme 
pode ser visto na Figura 16.18b. Infelizmente, todos esses modelos são vá- 
lidos numa faixa relativamente estreita de valores de u(k). De fato, para 
2,0V < u(k) < 2,6V, o modelo não-linear não é mais válido e, numa faixa 
um pouco mais ampla, o modelo torna-se instável. 

É importante notar que, ao se modelar o conversor buck em questão, 
qualquer que seja o modelo, é desejável que este incorpore a relação estática 
do conversor que é dada por 


vw =D 
vw = (=D = (1- 253 

d4vg Va. 

= rei (16.18) 
em que 
Taesligado 
4 — +deslig; 
Rap 


e T = Tigado + Tdesligado: Além disso i = 1 + 3 Taesligado/T é o valor em 
regime permanente de u(k). 

Observando-se a Eq. 16.18, percebe-se que um modelo linear não pode 
representar corretamente tal relação estática (ver Exercício 16.3). Isso ex- 
Plica a razão pela qual o modelo (16.15) tem dificuldades em aproximar os 
dados observados. 
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FicurA 16.17: Validação de modelos identificados 


Validação dos modelos (a) (16.15) e (b) (16.16). Os dados fo- 
ram obtidos decimando-se as séries da Figura 1.13 (AGUIRRE et 
al., 2000). (—) Medição, (— - —) simulação livre dos modelos 
(acgr000 O). 


FiGuRrA 16.18: Validação de modelo não-linear 


Validação do modelo (16.17). (—) Medição, (= : —) simulação 
livre. (a) os dados foram obtidos decimando-se a segunda metade 
das medições da Figura 1.13 (acq7000 0), e (b) dados obtidos 
a partir de um teste independente (AGUIRRE et al., 2000). 
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Quando uma constante é incluída na estrutura do modelo linear, o 
resultado é um modelo que não mais satisfaz o princípio da superposição, 
e portanto é não-linear. A característica não-linear de tal modelo ainda 
será uma reta no plano y x u, mas agora ela não passará pela origem (ver 
Exercício 16.4). 

A característica estática do modelo (16.17) pode, em princípio, ser ob- 
tida tomando-se j = y(k —i) e u=u(k—i), i = 0,1,2,3. Fazendo-se tais 
substituições, fica evidente que não é possível obter tal característica de 
forma analítica. Por causa disso, é desejável obter um modelo cuja caracte- 
rística estática não-linear possa ser obtida analiticamente. Como será visto, 
isso é possível à custa de uma pequena perda no desempenho de predição 
do modelo. Pelo fato de se estar utilizando o conhecimento (a priori) do 
formato da Eq. 16.18, o procedimento pode ser classificado como sendo de 
identificação caixa cinza. 

Assim, considerando-se que a característica estática não-linear do modelo 
deva ser da forma vo = y = f(úi), é uma questão simples mostrar que ter- 
mos da forma y(k — i)Pu(k — 3)"=P para m=0,... !-pep=2,...,;m com 
i=1,... My; j =1,... My não podem ser incluídos no modelo. Portanto, 
gerando um conjunto de termos candidatos que não contenha termos per- 
tencentes aos agrupamentos N,pym-p para m=0,... E-pe p=2,...;m 
com à =1,... My; j = 1,... Mu, obteve-se o seguinte modelo: 


y(k) = 1,2013y(k-1)-0,26082y(k—2) + 6,2479-2,6783u(k— 1)? 
—0,20807 y(k—3) + 8,8399u(k—1)2u(k—3) + 3,6636u(k—3)* 
—0,61623 u(k — 1)u(k — 3) — 9,7707u(k — 1)u(k — 3)? 
+Ve(k—1)06 + E(). (16.19) 


As predições desse modelo usando-se os dois conjuntos de dados de vali- 
dação são mostradas na Figura 16.19. Além disso, comparando-se a relação 
estática de tensão teórica e do modelo, percebe-se que a aproximação é 
muito boa na faixa 2V <u<4V,equeparalV<<2Vo erro máximo 
é de 10%, conforme pode ser visto na Figura 16.20. O fato de ter ajustado 
melhor a característica estática do conversor real conferiu ao modelo uma 
validade numa faixa de operação muito mais ampla do que a validade do 
modelo obtido “automaticamente” por métodos de identificação caixa preta. 
Acredita-se que o aumento na faixa de validade de modelos identificados seja 
uma característica geral do procedimento seguido nesta seção. Por outro 
lado, o procedimento descrito na Seção 15.2 é mais forte na medida em que 
garante uma melhor aproximação à função estática. Finalmente, o procedi- 
mento da Seção 15.3 garante que o modelo indentificado tenha exatamente 
a função estática imposta. 
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FIGURA 16.19: Validação de modelo não-linear 


Validação do modelo (16.19) obtido usando-se informação auxi- 
liar. (—) Dados medidos, (—--—) simulação livre. Dados obtidos 
(a) decimando-se a segunda metade das medições da Figura 1.13, 
e (b) a partir de um teste independente (AGUIRRE et al., 2000). 


FIGURA 16.20: Função estática para conversor buck 


Relação em regime permanente de tensões de entrada e saída. 
(=: —) Eq. 16.18, (—) característica estática do modelo (16.19). 
As cruzes indicam a faixa de valores varrida pela entrada durante 
o teste dinâmico. 
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16.5 Válvula Pneumática 


O objetivo na presente seção é a identificação de modelos para uma vál- 
vula pneumática. Além de dinamicamente válidos, deseja-se que os mode- 
los sejam também estaticamente válidos, ou seja, deseja-se que os modelos 
identificados incorporem não apenas a dinâmica da válvula, mas também 
a característica estática da mesma. Isso será feito usando-se algoritmos de 
estimação em batelada e, na próxima seção, será considerado o caso em que 
a estimação da característica estática do sistema será realizada de forma 
recursiva. 

No caso do sistema em estudo, o sinal de entrada u(k) é o sinal que 
comanda o posicionamento da válvula, ao passo que a saída y(k) é a vazão 
que passa pela válvula e é medida usando-se um sensor tipo turbina. Em 
função disso, o modelo obtido necessariamente incluirá características (es- 
táticas e dinâmicas) do conjunto válvula/turbina. A planta piloto em que 
foram coletados os dados é descrita em detalhes em (BRAGA, 1994). 

Além de objetivar que o modelo obtido consiga representar adequada- 
mente a relação estática que existe entre as variáveis do sistema, deseja-se ser 
capaz de escrever tal função analiticamente a partir do modelo identificado. 
A Figura 16.21 mostra a primeira parte de um teste dinâmico efetuado na 
planta piloto a partir da qual modelos foram identificados (JÁCOME, 1996), 
e o seguinte modelo foi identificado a partir dos dados mostrados nessa 


figura: 


uk) = 0,16897y(k—1)+0,67119y(k—2)—3,2838x 102u(k—2)º 
-2,7516u(k-3)2y(k-1)-4,0599u(k-3)y(k-2)-0,56531u(k-2)u(k-3)? 
+2,3475x 102+2,9223u(k—3)2y(k—2)+3,7770u(k=2)y(k— 1) 
0,78384 u(k—3)º—2,2363u(k—2)y(k—3)+3,4235u(k— 3) y(k—3) 
—0,25699 y(k— 3) -0,87313 u(k—2)u(k— 3) y(k—3) 


20 
+48,1003 x 10%u(k— 1)y(k—1) +35) Ô:€(k=i)+E(K), (16.20) 


i=l 


sendo que a parte de média móvel REM Ô:£(k-i) foi adicionada para reduzir 
o efeito de polarização, conforme discutido no Capítulo 7, mas não é usada 
nem nas simulações, nem para calcular a característica estática do modelo. 

A Figura 16.22 mostra a curva estática do conjunto composto pela 
válvula e pelo medidor de vazão do tipo turbina. Ressalta-se o fato de a 
válvula possuir uma zona morta apreciável para valores baixos da entrada, 
bem como a esperada saturação para valores elevados da entrada. 
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A simulação livre do modelo (16.20) para uma janela de dados sub- 
seqiiente à janela dos dados usados para identificação é mostrada na Figu- 
ra 16.23. Pode-se perceber que há desajustes nas extremidades de algumas 
oscilações. À razão para isso ficará evidente após considerarem-se as carac- 
terísticas estáticas tanto da válvula quanto do modelo, 

Seguindo-se o procedimento descrito no Complemento 10.5, pode-se fa- 
zer a análise do modelo (16.20) em estado estacionário. Procedendo assim, 
chega-se à seguinte equação: 


0416837 = 2,3475 x 1072 + 0,91234 7 — 0,70248 025 + 0,1856903 
2,3475 x 10-2 + 0,1856913 
0,41683 — 0,912347 + 0,7024872" 


= (16.21) 


que é mostrada na Figura 16.22 juntamente com a característica estática 
medida da válvula. Como pode ser visto, o ajuste é bastante satisfatório, à 
exceção dos extremos e do centro. Para valores baixos de i o ajuste não é 
bom em função da zona morta da válvula. Para valores intermediários de 
o conjunto válvula /turbina apresenta uma ressonância. 
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FIGURA 16,21: Teste dinâmico em válvula pneumática 


Sinais de (a) entrada e (b) saída resultantes de um teste dinâmico 
no conjunto válvula/turbina (valvula O). A entrada é o sinal 
que comanda a válvula e a saída é o sinal de vazão medido pela 
turbina. 
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) 0 02 03 04 


05 os o os o 1 
bartu) (pu) 
Figura 16.22: Características estáticas de válvula 


Características estáticas (—) medida para o conjunto válvu- 
la/turbina, e (-—) Eq. 16.21 obtida a partir do modelo (16.20). 


dep a 144 
1050 1100 1150 1200 1250 1300 1350 1400 1450 1500 
número de amostras 


FIGURA 16.23: Validação de modelo da válvula 


Validação de modelo do conjunto válvula /turbina. (—) dados 
medidos e (——) simulação livre do modelo (16.20). 


A fim de poder aproximar bem a característica estática medida nes- 
ses pontos, seria necessário um modelo que tivesse funções de base que 
fossem suficientemente flexíveis de maneira a permitir ajustar o modelo aos 
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dados. Isso poderia ser conseguido, em princípio, aumentando-se o grau de 
não-linearidade da representação polinomial ou escolhendo-se outro tipo de 
representação matemática. Entretanto, tais diferenças não foram julgadas 
críticas no presente exemplo. Finalmente, é possível conseguir-se um me- 
lhor ajuste da característica estática para valores elevados de ii sem mexer 
na estrutura do modelo (JÁCOME, 1996). 


16.6 Aquecedor com Dissipação Variável 


O sistema utilizado na presente seção consiste de um pequeno aquecedor 
elétrico com dissipação variável. Tal variação é efetuada acionando-se um 
ventilador. Os sinais de entrada e saída desse sistema são, respectivamente, 
a tensão elétrica aplicada ao aquecedor e a saída amplificada de um termo- 
par. Os objetivos na presente seção são basicamente três. Primeiramente, 
deseja-se identificar modelos que descrevam a dinâmica do aquecedor. Em 
segundo lugar, objetiva-se obter modelos que além de alcançar o primei- 
ro alvo representem também a relação estática entre tensão de entrada e 
temperatura do aquecedor. Esses dois objetivos são os mesmos da seção 
anterior. Na presente seção, entretanto, pretende-se ir um passo adiante. 
Deseja-se realizar um teste dinâmico em que a dissipação do aquecedor é 
alterada e usar técnicas de estimação recursiva de parâmetros, como as 
descritas no Capítulo 8 para acompanhar recursivamente as mudanças na 
característica estática do sistema, 


16.6.1 Descrição de testes e dados 


Dois tipos diferentes de testes foram efetuados no sistema. Nos testes es- 
táticos, para cada valor do sinal de entrada, esperava-se a estabilização da 
temperatura. Esse conjunto de dois valores estacionários podem ser repre- 
sentados como um ponto num gráfico. Tal gráfico representa a característica 
estática, ou seja, a característica do sistema em estado estacionário. Pelo 
fato de ter que esperar até o sistema atingir o regime estacionário, esses tes- 
tes são normalmente demorados. No presente exemplo, foram necessárias 
três horas para se obter a característica estática do sistema em cada teste 
(Cassini, 1999). 

Nos testes dinâmicos, projetou-se um sinal aleatório e aplicou-se tal 
sinal na entrada, sendo que a saída era medida utilizando-se um termopar 
conectado a um amplificador de instrumentação. Durante o teste, cada 
valor aleatório do sinal de entrada era mantido constante por 10 segundos. 
A taxa de amostragem escolhida foi igual a 1 segundo, para a coleta de dados 
durante os testes. Seguindo-se o procedimento da Seção 12.2.3, achou-se um 
fator de decimação igual a 12. Portanto, os sinais de trabalho têm período 
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de amostragem de 12 segundos. Tanto o sinal de entrada quanto o sinal 
de saída estão em p.u., sendo que 1 p.u. do sinal de entrada corresponde a 
136 V (rms), e 1 p.u. do sinal de saída corresponde a 998,51 ºC. Os primeiros 
7.500 segundos de dados de um teste (ver Figura 16.24) foram usados na 
identificação de modelos, conforme descrito na próxima seção. 


Õ 


o 1000] 2000 3000] o 5000 8000 7000 
tes) 


FIGURA 16.24: Entrada e saída de aquecedor 


Dados de (a) entrada e (b) saída do aquecedor com dissipação 
variável. Durante o teste que deu origem aos dados desta figura, 
não se variou a dissipação do aquecedor (primeira metade de 
din3 O). 


16.6.2 Identificação de modelos 


Os dados mostrados na Figura 16.24 foram utilizados na identificação de 
diversos modelos lineares e não-lineares (CASSINI, 1999). A seguir, mostram- 
se dois desses modelos: o linear, 


v(k) = 14575y(k — 1) + 0,0359u(k — 1) — 0,5374y(k — 2) 


5 
—0,0096 u(k — 2) + >) di€(k — 1) + €(k), (16.22) 


i=l 
e o não-linear, 
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ylk) = 1,2929y(k — 1) +0,0101 u(k — 2) u(k — 1) + 0,0407 u(k — 1)? 
—0,3779 y(k — 2) — 0,1280u(k — 2) y(k — 1) 
+0,0957 u(k — 2) y(k — 2) + 0,0051 u(k — 2)? 


5 
+ dielk — à) + €(h). (16.23) 


i=l 


As simulações livres dos modelos (16.22) e (16.23) são mostradas nas 
Figuras 16.25 e 16.26, respectivamente. Os dados usados para essa validação 
foram os correspondentes à segunda metade do teste dinâmico, cujos dados 
estão no arquivo din3 O, 


As simulações livres das Figuras 16.25 e 16.26 revelam que o modelo 
linear tem dificuldade de acompanhar os dados nos extremos, Essa caracte- 
rística normalmente aponta para a “falta de não-linearidade”, pois revela que 
o ganho do modelo, apesar de adequado em uma faixa de operação, é inade- 
quado nas faixas extremas. Essa hipótese parece confirmada pelo excelente 
desempenho do modelo não-linear (16.23), conforme visto na Figura 16.26. 


ie is CÊ ie seit ' 
Boo 700 800 00 1000 1100) 1200 1300 
amostras 


FIGURA 16.25: Validação de modelo linear 
Validação do modelo (16.22). (—) Medição, e (o) simulação 
livre (segunda metade de din3 0). A dificuldade do modelo de 


atingir alguns valores extremos indica a inadequação do ganho 
do modelo (CAssINI, 1999). 


Digitalizado com CamScanner 


616 16 EstuDos DE Caso 


temperatura (pu) 
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Soo 700 800 300 1000 1100 1200 130 
amostras 


FIGURA 16.26: Validação de modelo não-linear 


Validação do modelo (16.23). (—) Medição, e (o) simulação livre 
(segunda metade de din3 O) (Cassini, 1999). 


Seguindo-se o procedimento descrito no Complemento 10.5, as funções 
que descrevem as características estáticas dos modelos (16.22) e (16.23) são, 
respectivamente, 


(16.24) 


0,0559 12 


“= 00850 +0,03234' (ancah) 


As Egs. 16.24 e 16.25 são mostradas na Figura 16.27. 


Claramente, o modelo (16.23) tem uma característica não-linear muito 
mais próxima daquela que foi medida do que a do modelo linear (16.22), cujo 
ganho, que é a inclinação da função j = f(ú), é constante. Essa divergência 
entre a característica estática do processo e a do modelo linear (16.22) é, em 
boa parte, responsável pelas diferenças observadas na Figura 16.25 entre as 
medições e a predição livre. 
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bar(u) (tensão p.u.) 


FIGURA 16.27: Características estáticas: medida e estimadas 


Característia estática (—) medida em teste estático, 
(-—) Eq. 16.24 do modelo linear (16.22) e (— - —) Eq. 16.25 do 
modelo não-linear (16.23) estat3 0). 


A Figura 16.27 deve ser comparada com a Figura 10.8. A diferença entre 
tais figuras reside no fato de que os modelos mostrados nesta seção foram 
obtidos a partir de testes em que a dissipação do aquecedor era maior. 

Isso pode ser observado notando-se que, para o mesmo valor de entrada, 

a temperatura do aquecedor estabiliza em valores mais baixos no caso da 

Figura 16.27. Antes de passar para à próxima seção, deve ser apreciado que 

o modelo (16.23) não só acompanha bem dinamicamente o processo, mas 

também incorpora a característica estática não-linear do mesmo, sendo que | 
tal função pode ser obtida analiticamente a partir do modelo. Isso facilitará 

o uso de algoritmos recursivos na estimação de funções como à Eq. 16.25. 

O sistema modelado nesta seção foi também utilizado nos Exem- | 
plos 15.3.1, 15.4.1 e 15.44 no contexto de identificação caixa cinza. As I 
representações utilizadas foram, respectivamente, modelos polinomiais, 
redes MLP e redes RBF, Em cada caso, além do registro de dados dinâmi- | 
cos, informação auxiliar sobre o comportamento em estado estacionário foi 
utilizada, 


Nesta seção, o objetivo é estimar recursivamente características estáticas do | 
tipo (16.25) durante mudanças na dissipação do sistema. A fim de alcan- || 


| 
| 
| 
16.6.3 Estimação recursiva de características estáticas | 
1] 
gar isso, será identificado um modelo não-linear para o qual a característica | 
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estática possa ser obtida analiticamente em função dos parâmetros estima- 
dos. À estrutua utilizada foi: 


ul) = Ôro(Lylk — 1) + Ôo,2(1,1) u(k — 1)2 + 0,0(2) v(k — 2) 
+Ô11(1,2) u(k — 2) y(k — 1) + Ô1,1(2,2) u(k — 2) y(k — 2) 
+09, 2(2,2) u(k — 2)? + Ô9,2(2,1) u(k — 2) u(k — 1) 


5 
+ die(k — à) + €(h). (16.26) 
i=l 


Realizou-se um teste em que a dissipação do aquecedor foi mudada na 
metade do ensaio. Os dados de entrada e saída de tal teste são mostrados 
na Figura 16.28, em que fica evidenciado que aproximadamente na metade 
do ensaio há uma mudança nas características do sistema. 


(a) 


o 1000 2000 4000 
ts) 


FIGURA 16.28: Entrada e saída de aquecedor 
Dados de (a) entrada e (b) saída do aquecedor com dissipação 


variável. A dissipação do aquecedor foi variada na metade do 
ensaio (din4 O). 


Tomando-se os dados da Figura 16.28, deseja-se estimar a característica 
estática não-linear a cada tempo de amostragem, ou seja, de 12 em 12 
segundos. Para isso escolheu-se a estrutura do modelo (16.26), sendo que 
os parâmetros foram estimados recursivamente com fator de esquecimento 
igual a À = 0,99 e com matriz de covariância inicial igual a Py = 1000!T, 
sendo II uma matriz unitária 12x 12, conforme detalhado na Seção 8.5. À 
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razão de ter-se escolhido a estrutura do modelo (16.26) está relacionada às 
condições discutidas no Complemento 10.5. 


A Figura 16.29 mostra o conjunto de características estáticas (uma a 
cada 12s) obtidas a partir dos dados da Figura 16.28. Evidentemente, 
foi possível estimar tais funções recursivamente, o que permitiu monitorar 
o sistema ao longo do teste. Vale mencionar que esse procedimento foi 
grandemente facilitado devido à cuidadosa escolha da estrutura do modelo 
(16.26). Procedimento similar ao descrito acima poderia ser, em princípio, 
usado na monitorização de sistemas, na detecção de falhas e no ajuste de 
controladores. 


E 


E 


E 
F! 
â 
ju 


FIGURA 16.29: Estimação recursiva de características estáticas | 


Duas vistas da mesma segiiência de características estáticas não- 
lineares estimadas recursivamente a partir dos dados mostrados 
na Figura 16.28, usando-se a estrutura (16.26). No gráfico à 
esquerda, a lateral esquerda corresponde à característica estática 
com baixa dissipação, parecida à mostrada na Figura 10.8; No 
gráfico à direita, a lateral direita corresponde à dissipação mais 
alta, parecida à mostrada na Figura 16.27 (CASSINI, 1999). 


A Figura 16.30 mostra os coeficientes D,, e Ly;u para i = 1,2. Após ligar 
o ventilador, nota-se que a importância dos termos Byy e Dyu diminuem 
muito. Isso significa que a função de autovalores (ver Complemento 10.6) 
deixa de ser influenciada pela entrada (veja a antepenúltima e penúltima 
linhas da Tabela 10.2). Esse resultado é confirmado pela Figura 16.31 (Cor- 
RÊA, 2001; AGUIRRE et al., 2002). 
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o 1000 2000 3000 4900 000 6000 7000 


FIGURA 16,30: Coeficientes da função de autovalores 


Valores de (- -) Ly e (—) Ly para (a) i=1e(b)i =2. 
Após a amostra 3400, tem-se que Eu — O, que indica que os 
autovalores tornam-se menos sensíveis ao ponto de operação na 
nova configuração (AGUIRRE et al., 2002). 


(a) 


Figura 16.31: Autovalores do aquecedor 


Raízes de (10.86) para O < ú < 1, para dois modelos obtidos 
com o ventilador (a) desligado, e (b) ligado. Conforme esperado 
(ver Tabela 10.2 e Figura 16.30), os autovalores são muito menos 
sensíveis ao ponto de operação quando o ventilador está ligado 
(AGuiRRE et al., 2002). 


4 
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8 importante fazer uma distinção aqui. Uma das características de 
sistemas não-lincares é o fato de tais sistemas poderem se comportar de 
forma variada em pontos de operação diferentes. Por exemplo, um sistema 
com saturação tem ganho muito menor na saturação do que em pontos de 
operação fora da saturação. Uma classe de sistemas não-lineares é formada 
por processos para os quais a única característica que muda com o ponto 
de operação é o ganho. À excessão do ganho, os autovalores dos modelos 
de tais sistemas linearizados em torno do ponto de operação não variam 
com o ponto de operação. Tal classe de sistemas pode ser representada por 
modelos de Hammerstein, conforme apresentado na Seção 1.2.2. 

Outra classe de sistemas, por sua vez, tanto o ganho como a dinâmi- 
ca (caracterizada pelos autovalores do modelo linearizado) variam com o 
ponto de operação. Essa classe não é bem representada por modelos de 
Hammerstein, sendo que os modelos de Wiener passam a ser uma alterna- 
tiva de representação. No estudo de caso em questão, parece correto inferir 
que ao se ligar o ventilador o sistema passa de um processo tipo Wiener 
para um tipo Hammerstein. 


16.7 Dados de Sistema Respiratório 


Os dados descritos na presente seção foram obtidos de um paciente do sexo 
masculino, de 49 anos de idade, no Sleep Laboratory do hospital Boston 
Beth Israel. Tais dados foram descritos detalhadamente em (RIGNEY et al., 
1994). 

O paciente sofre paradas respiratórias (apnéia) durante o sono. 
Resumidamente, durante o sono o paciente pára de respirar durante pe- 
ríodos que podem durar de 20 segundos a 1 minuto. Consegiientemente, o 
oxigênio no sangue diminui significativamente, o que leva o paciente a vol- 
tar a respirar profundamente durante poucos segundos após os quais ocorre 
nova parada respiratória, dando início a um novo ciclo. Por essa razão esse 
padrão respiratório é, às vezes, chamado de respiração periódica. Durante a 
respiração normal o nível de oxigênio é praticamente constante, mesmo ha- 
vendo pequenas variações nas fregiiências respiratórias e cardíaca. O estágio 
intermediário é informalmente chamado de apnéia intermitente. 

Os dados considerados nesta seção consistem de três séries temporais, a 
saber: í) frequência cardíaca (FC), ii) respiração (R) e iii) saturação de oxi- 
gênio no sangue (SOS). As séries temporais R e SOS foram simultaneamente 
amostradas durante 4 horas e 43 minutos a uma frequência de 250 Hz, e sub- 
seqiientemente filtrados e decimados a uma taxa de 2Hz, Portanto, o tempo 
de amostragem utilizado na seguinte análise é precisamente Ty = 0,55, o que 
resulta em séries com 34.000 observações. Evidentemente, como será discu- 
tido a seguir, janelas de dados de duração muito mais curta serão usadas. 
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Por outro lado, a série FC foi obtida a partir do pré-processamento dos in- 
tervalos R-R. (interpolação e amostragem uniforme) de forma a se ter uma 
série resultante com uma taxa de amostragem de 2Hz. As Figuras 16,32 
e 16.33 mostram as três séries temporais para, respectivamente, os quadros 
de respiração normal e apnéia. 


8000] 
6000) 
4000] 
2000 
faz 1,33 1,34 1,35 1,36 1,37 1,38 
x 10º 
x 10! 
2 
º 
-2+ 
1,32 1,33 1,34 135 1,36 137 1,38 
x10t 
100 
8o 
80 
1,32 1,33 1,34 135 1,36 197 1,38 
x 10º 


FIGURA 16.32: Dados de respiração normal 


Dados de respiração normal. De cima para baixo: SOS, R e FC. 
Para os sinais SOS e R, o eixo das ordenadas se encontram em 
bits do conversor A /D utilizado, e para a série FC as ordenadas 
estão em batimentos por minuto (AGUIRRE et al., 1999). 


Deseja-se obter modelos a partir dos dados descritos, e verificar a pos- 
sibilidade de analisar o “sistema” usando-se tais modelos. Primeiramente, 
é necessário definir que janelas de dados utilizar durante a identificação. É 
interessante poder escolher janelas onde os três padrões respiratórios, menci- 
onados acima — normal, periódica e apnéia intermitente—, são observados. 


Além disso, é desejável que os dados ao longo de tais janelas sejam es- 
tacionários. Uma vez que ainda não existem ferramentas confiáveis para 
garantir que uma determinada janela de uma série temporal é estacionária, 
adotou-se o procedimento comum de se trabalhar com janelas relativamen- 
te curtas, o que não garante a estacionariedade dos dados, mas aumenta a 
probabilidade de tais dados serem descritos por modelos e processos esta- 
cionários. Foram usadas séries de N = 600 observações, o que corresponde 
a períodos de tempo da ordem de 300 segundos. As séries FC e R foram 
usadas como entradas, e a série SOS foi usada como saída. 
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FiGURA 16.33: Respiração periódica (apnéia) 


Respiração periódica (apnéia). De cima para baixo: SOS, R e 
FC. Para os sinais SOS e R o eixo das ordenadas se encontram 
em bits do conversor AD utilizado e para a série FC as ordenadas 
estão em batimentos por minuto (AGUIRRE et al., 1999). 


16.7.1 Modelos identificados 


Diversos modelos foram identificados (BARROS, 1997) a partir dos dados 
correspondentes aos padrões de respiração normal, apnéia e apnéia inter- 
mitente. Um modelo obtido a partir de dados correspondentes à apnéia 
intermitente é: 


v(k) = +0,84682y(h-1)-0,1824y(k-5) +4,8958 ui(k-25) +0,28841y1(k-3) 
-0,60945x10"1u, (A-25)u, (k-10)-0,25536x10“ua (19) ua (k-16) 
+40,9178x10ua (A-15) ua (R-10) +0,18054x107us(k-23)u(k-13) 
-0,45048x10ua (A-25) ua (619) +0,34863x10Cuo (619) ua (17) 
+0,29419x107"ua (k-24) ua (k-13) +0,97696x10"7u, (k-21) ua (k-18) 
+40,57425x10"u (A-10)ya (k-2)+0,31489x10%u, (A-25) ua (h-24) 
+40,27073x10"“ua (k-19) ua (k-19)-0,60194 x 107 us (k-24)u2 (20) 
+40,16208x10"Sua (A-17) ua (6-17)-0,15039 x 10% ua (A-17)yn (6-3) 
+40,13815x10tua (617) ya (A-2) +0,32702x10%ua (17) ua (k-16) 


19 
+53. dielk=)+E(h), (16.27) 
i=l 


sendo que u(k) é FC, uz(k) é R e E(k) são os resíduos. O somatório é 
a parte média móvel do modelo, incluída a fim de reduzir os efeitos da 
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polarização. Conforme visto no Capítulo 7, o algoritmo requerido para 
estimar o modelo acima é o estimador estendido de mínimos quadrados 
(EMQ). Como mencionado também na Seção 13.2, os resíduos não são 
usados na simulação dos modelos identificados. 

Outro modelo (não mostrado) não-linear SISO foi obtido com R como 
sinal de entrada e SOS sendo a saída. O número de termos do modelo foi 
determinado de forma empírica, baseando-se no desempenho dos modelos | 
identificados. Vale ressaltar que esse procedimento é possível no contexto 
de modelos não-lineares pelo fato de os regressores candidatos terem sido | 
previamente ordenados por ordem de importância, conforme discutido na 
Seção 11.3. 

A fim de permitir uma comparação mais ampla dos resultados, o seguinte | 
modelo multivariável linear foi obtido, usando-se os mesmos valores para os | 
atrasos máximos ny € ny: | 


v(k) = 0,7172y(k-1)-1,5950 x101y(k-5)+6,7479x10-tu, (k-5) 
+9,0803x102y(k-3)-6,2393x10"1u, (k-10) +1,3927x102 
+5,8767x10?u (k-23) + 1,0862x10“ua(k-16)-3,1096x10-y(k-2) 
+1,2025x10“ua (k-10) +1,6693x10 “ua (k-24) + 1,7519x10%uo(k-19) 
+1,6700x10“ua (k-15)-1,3103x10*ua (k-25) +1,0895x102ua (k-13) 
+9,717x10ua (k-17) +1,1443x10ua (k-21)-9,1373x10-*uo (18) 


19 
49,7509x10-tu2(6-22) +0,34901 ui (h-18) + 3 Ô,€(6-) + (1). 
i=l 


(16.28) 


Os modelos foram validados de duas formas distintas, conforme discutido 
no Capítulo 13, Primeiramente, funções de correlação linear e não-linear 
foram usadas para verificar quão brancos eram os resíduos de identificação. 
Essa análise constatou que não havia correlações lineares nem não-lineares 
significativas nos resíduos. Numa segunda etapa, os modelos foram utili- 
zados para simular dados, que foram comparados aos dados medidos em 
janelas diferentes daquelas utilizadas para a identificação. Alguns desses 
resultados foram mostrados na Figura 13.5. Quando se trata de dados possi- 
velmente não estacionários é comum fazer simulações e predições em janelas 
relativamente curtas (por exemplo, 20% da janela usada para a identifica- 
ção) e contínuas à janela de identificação. O uso de janelas descontínuas em 
validação é um teste muito mais difícil e, no caso de dados não estacioná- 
rios, tal procedimento acaba revelando mais sobre a não-estacionariedade 
dos dados do que propriamente sobre os modelos identificados. 

A Figura 16.34 mostra o desempenho de três modelos identificados. 
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2915 2,92 2,925 293 2.995 2.94 
x 10 


Figura 16,34; Índice RMSE para modelos de dados biomédicos 


Índice RMSE (13.1) calculado usando-se 100 pontos de uma ja- 
nela de validação móvel. (—) Modelo multivariável não-linear 
(16.27), (+: -) modelo multivariável linear (16.28) e (-:—) modelo 
SISO não-linear com R como entrada. Os respectivos modelos 
são comparáveis em termos de nu, ny € número de regressores, 
tendo sido estimados a partir do mesmo conjunto de dados. O 
eixo das abcissas indica o número das observações corresponden- 
te às séries originais (AGUIRRE et al., 1999). 


A fim de gerar a Figura 16.34, os modelos foram usados para simular o 
sinal SOS a partir dos sinais de entrada R e FC. A comparação entre o sinal 
SOS simulado e o medido foi feito ao longo de uma janela móvel de 100 pon- 
tos, usando-se 0 Índice RMSE (13.1). Claramente, o modelo multivariável 
não-linear consegue explicar os dados de forma muito mais exata ao longo 
de janelas perto da janela de identificação. À medida que se consideram 
dados mais distantes dos dados de identificação, nota-se que o desempenho 
do modelo multivariável não-linear torna-se pior do que o do modelo mul- 
tivariável linear, cujo desempenho não parece variar significativamente ao 
longo do tempo. Por outro lado, não há dúvida que o modelo monovariável 
não apresenta bom desempenho. 

Os resultados das diversas simulações confirmam o caráter multivariável 
do conjunto de dados. Isso pode ser facilmente observado, uma vez que o 
melhor modelo SISO é significativamente pior do que os modelos multivariá- 
veis, incluindo o modelo multivariável linear (16.28). Por outro lado, as si- 
mulações mostraram que os modelos não-lineares representam os dados com 
razoável exatidão a curto prazo (em torno de dois minutos), enquanto em 
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simulações de médio prazo os modelos lineares são bastante competitivos. 
Isso sugere que os dados possuem duas características. Em primeiro lu- 
gar, os dados são em alguma medida não-lineares, pois caso contrário não 
haveria razão para os modelos não-lineares apresentarem resultados signi- 
ficativamente melhores em simulações a curto prazo. Em segundo lugar, 
percebe-se que os dados são não-estacionários, e qualquer modelo que não 
seja recursivamente atualizado perde a capacidade de explicar os dados ade- 
quadamente. Além disso, tais diferenças devidas à não-estacionariedade são 
manifestadas de forma mais significativa nos modelos não-lineares, que são 
mais sensíveis a mudanças na estrutura e nos parâmetros do que modelos 
lineares. 


16.7.2 Análise de estabilidade baseada em modelo 


A fim de dar início à análise dos dados, na presente seção, três janelas da 
série SOS foram representadas no plano de fase na Figura 16.35. 


(a) (b) (e) 


FIGURA 16.35: Reconstrução no plano de fase 


Reconstrução no plano de fase da série SOS. (a) Respiração nor- 
mal referente à Figura 16.32a, (b) apnéia intermitente e (c) res- 
piração periódica referente à Figura 16.33a. Em todos os gráfi- 
cos as abcissas são y(k), e os eixos das ordenadas são y(k — 8) 
(AGUIRRE et al., 1999). 


Em particular, as séries de SOS das Figuras 16.32 e 16.33 são mostradas 
no plano de fase nas Figuras 16.35a-c, sendo que a série temporal correspon- 
dente à Figura 16.35b não é mostrada. As Figuras 16.35a-c correspondem 
à respiração normal, apnéia intermitente e apnéia propriamente dita, e su- 
gerem que a transição de respiração normal para apnéia pode ser associada 
à perda de estabilidade do ponto fixo correspondente, que pode ser visto na 
Figura 16.32a. 
A questão que surge é se os modelos de respiração normal e apnéia 
conseguiram incorporar essa informação dinâmica característica de cada | 


| 
da 
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padrão respiratório. Considera-se a seguinte hipótese: no caso de respiração 
normal tem-se um ponto fixo estável, ao passo que no caso de apnéia o ponto 
fixo é instável, circundado por um ciclo limite estável, mas ruidoso. 

A fim de se verificar a hipótese levantada no parágrafo anterior, 0 se- 
guinte procedimento foi seguido: 


1. escolher um modelo e uma janela de dados de interesse. Para cada 
instante, os respectivos valores de u1(k) e u2(k) foram substituídos 
no modelo. Procedendo-se assim, chega-se a uma equação que tem 
a seguinte forma y(k) = g(c y(k — 1)...y(k — ny)], sendo g[:] um 
polinômio, normalmente não-linear, e c é uma constante; 


2. determinar a matriz jacobiana da equação obtida no primeiro passo, 
ou seja, determinar 99[:)/0y, sendo y = [y(k — 1) ... y(k — ny)]”. Se 
a equação for linear, a matriz jacobiana será uma matriz constante; 


3. se a equação for não-linear, a matriz jacobiana dependerá de valo- 
res atrasados de y(k). Nesse caso, deve-se estimar a localização do 
ponto fixo 7 a partir dos dados, usando-se o algoritmo descrito no 


Complemento 10.3; 


4. substituir na matriz jacobiana o valor estimado no passo anterior, ou 
seja, considerar y(k — 1) =... = y(k — ny) = 7. O resultado será 
uma matriz constante cujos ny autovalores podem ser determinados e 
representados graficamente; 


5. repetir os passos 1 a 4 até o fim da janela de dados, 


Os gráficos da Figura 16.36 mostram os autovalores estimados conforme 
descrito acima e foram obtidos usando modelos de respiração normal com 
dados de respiração normal e usando modelos de respiração periódica com 
dados de respiração periódica, A necessidade de se usar dados além dos mo- 
delos deve ficar evidente a partir dos passos 1 e 4 do procedimento descrito 
anteriormente, Nessas figuras, o limite de estabilidade é o círculo de raio 
unitário, Logo, quanto mais próximos ao círculo estiverem os autovalores, 
menos estável será o ponto fixo em questão. À Figura 16.36 sugere que, de 
fato, a dinâmica associada à respiração normal é bem mais estável do que no 
caso de respiração periódica. Pode-se conjecturar que a respiração normal 
pode ser caracterizada por um ponto fixo estável, ao passo que a respiração 
periódica pode ser caracterizada por um ponto fixo instável localizado no 
interior de um ciclo limite estável. 
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FIGURA 16.36: Análise de estabilidade de respiração 
Autovalores no plano complexo para modelo de respiração e duas 
janelas diferentes de respiração normal: (a) janela de identifica- 
ção e (b) janela de validação. Semelhantemente, o modelo de 
respiração periódica foi usado na (c) janela de identificação e na 
(d) janela de validação (AGUIRRE et al., 1999). 


Como mencionado acima, no primeiro passo do procedimento descrito 
acima, não apenas o modelo é utilizado, mas também é utilizada informação 
dos dados para obter g[:]. Portanto, é questionável se a estabilidade e insta- 
bilidade mencionadas acima são características do modelo ou dos dados. A 
fim de esclarecer esse ponto, utilizaram-se os mesmos modelos, só que com 
os dados trocados. Ou seja, o modelo de respiração normal foi usado jun- 
tamente com os dados de respiração periódica, e vice-versa. Os resultados 
foram muito semelhantes aos mostrados na Figura 16.36. Isso parece con- 
firmar que a informação sobre a estabilidade dos pontos fixos encontra-se 
fundamentalmente nos modelos obtidos e, consegientemente, tais modelos 
poderiam ser utilizados na análise dos diversos padrões respiratórios. 


| 
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Os resultados nesta seção sugerem que os modelos identificados podem 
ser utilizados para quantificar a estabilidade do ponto fixo no plano de fase 
obtido, fazendo-se a imersão da série temporal de SOS. Além disso, parece 
adequado associar a parada respiratória à perda de estabilidade (bifurca- 
ção) desse ponto fixo. Evidentemente, não é necessária nenhuma análise 
de estabilidade a fim de verificar que o paciente parou de respirar. Mas o 
fato de poder usar modelos para medir a estabilidade e assim quantificar, 
em alguma medida, o padrão respiratório poderá facilitar a monitorização 
de pacientes, especialmente tendo em mente que os modelos, uma vez obti- 
dos, podem ser mantidos atualizados utilizando-se as técnicas de estimação 
recursiva de parâmetros descritas no Capítulo 8. Além disso, estudos pre- 
liminares indicam que é possível detectar o movimento dos autovalores do 
centro do círculo de raio unitário em direção à periferia alguns segundos 
antes de se perceber modificações na morfologia do sinal SOS. Sendo assim, 
os métodos de identificação de sistemas descritos ao longo deste livro po- 
deriam ser usados como ferramentas para monitorização e detecção precoce 
de apnéia. 

Em estudo posterior utilizando o mesmo conjunto de dados o alvo foi 
o de se obter modelos autônomos do tipo descritos no Complemento 10.1 
(mas sem entradas exógenas) e verificar se era possível fazer uma análise de 
estabilidade baseada em tais modelos (AGUIRRE; SOUZA, 2004). 

Um dos modelos obtidos é mostrado nas equações (16.29)-(16.31), sendo 
que yi(k) é o sinal de respiração R, ya(k) é o sinal de fregiiência cardíaca 
FC e ys(k) é o sinal de saturação de oxigênio no sangue SOS. 


w(k) = 0,6230(k — 1) — 0,25688x 10"! (k — 2) 
+0,55389 n(k—3)yi (k— 1) — 0,31659 ya (k—3) — 0,19599y (k—7) 
—0,16718 3 (k — 12)y (k — 11) + 0,34427 ya(k — 2) (k — 10) 
+0,088007 n(k — 21) — 0,73672 ya(k — Dyr(k — 9) 
—0,5221 ya(k — 12)ya (k — 9) + 0,45096 ya(k — 11)yi (k — 8) 
=0,077558 ya (k—4) — 0,19665 ya (k—4) + 0,62173 a (k — 4)y (k— 2) 
-0,32807y (k — Lya (k — 1) — 0,55717 ya (k — 10)ya (k — 3) 
—0,4287 pi (k = 12)y (k—6) —0,085675 + 0,35258 ya (k— 2)yn (k— 1) 
+0,35199 ya (k — 5)yn (k — 5) — 0,10598 ya(k — 9), 

(16.29) 


mlk) = 1,309y2(k = 1) +0,03914 ya (k — 2) — 0,5597 ya(k — 2) 
+0,02864 ya(k — 7) + 0,1521 ya(k — 3) — 0,3186y) (k — 1) 
+0,7246 ya(k — Tn (k — 1) — 0,254 yo(k — 2)y (k — 3) 
—0,2245 ya (k — Dyn (k — 8) — 0,5088ya(k — 2)ya (k — 1) 
—0,1853 y(k = Ty (k — 1) — 0,1413 yo (k — 6)ya(k — 1), 


(16.30) 
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vs(k) = 0,8129ys(k—1)-0,07469 yo(k—9) —0,03502 qa (k— 25) ya (k — 19) 

—0,05082 ya(k — 5) + 0,5737 x 10-2ya(k — 24)yi (k — 3) 
+0,2006 ya(k — 3) + 0,8764 x 102, (k — 24) 
+0,02905 ya (A — 3)yy (k — 19) — 0,01997 ya (k — 4) (k — 3) 
-0,03121yi(k — 23)y (k — 17) — 0,6765x 10-2y; (k — 6) ya (k — 6) 
+0,01625 yi (k — 21)ya (k — 20) — 0,01912y 1 (k — 11)ys (k — 11) 
+0,01871y (k— 22)y, (k— 22) =0,01078 yi(k— 24)yn (k— 7) = 0,005202 
+0,1164 ya (k — 8)ya (k — 2) + 0,02352 ya (k — 19)ya(k — 15) 
—0,01967 ya(k — 1)ya (k — 3) — 0,01027 ya (k — 23)yn (k — 2) 
—0,03087 yi (k — 20)yn (k — 15) + 0,01358 pi (k — 25)yi (k — 12) 
—0,01823yi (k — 16) ya (k — 1) — 0,2626 ya (k — 25)yn (k — 1) 
—0,2586 ya(k — 24)yi (k — 7) — 0,01539 yi (k — 20)gn (k — 10) 
—0,1732 ya(k — 25)ya(k — 16) + 0,1137 ya(k — 2). 

(16.31) 


A simulação livre do modelo (16.29)-(16.31) resulta em sinais periódicos 
para as três variáveis de saída y(k), ya(k) e ya(k). A Figura 16.37 com- 
para o movimento torácico descrito pelo modelo com a média de 15 ciclos 
de respiração normal medidos. É interessante notar que, se, por um lado, 
yi(k) tem um comportamento bastante similar ao observado na prática (ver 
Figura 16.37), por outro, y2(k) e y3(k) não apresentam tal característica. 
Sendo assim, pode-se concluir que, do ponto de vista de simulação, as va- 
riáveis y2(k) e y3(k) são auxiliares no sentido de que seu comportamento é 
tal que y(k) tenha um aspecto realista. 

Deve ser notado que um dos aspectos não-lineares da respiração — a ins- 
piração é mais rápida que a expiração — está bem representada no modelo. 
Não é possível obter-se um modelo linear com tais características. 


Finalmente, a fim de investigar a utiliade do modelo (16.29)-(16.31) no 
estudo de estabilidade do sistema respiratório, derivou-se a matriz jacobiana 
para o terceiro subsistema, ou seja, a partir da Eq. 16.31. A escolha da va- 
riável y3(k) para a análise foi motivada pelos estudos preliminares efetuados 
com os modelos não-autônomos, Assim, a matriz jacobiana é 


Jsos = Oox1 Toxa , (16.32) 


Ja Ja Ja Ja Jys Ja Jy Jy és 


em que 0gx1 é um vetor com oito zeros e Igxg é a matriz identidade de 
dimensão 8. 


d 
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FIGURA 16.37: Movimento de tórax durante respiração normal 


A linha cheia é a média de 15 ciclos de respiração normal tomados 
no conjunto de dados medido em hospital. As barras indicam 
30. À linha tracejada é um período de y (k) do modelo (16.29)- 
(16.31) (Souza, 2001). 


Os elementos da última linha de Jsos são: 


BIBLIUTECA = jG1H = jin 


Jay = 08129 Jao = 0,1164ya(k — 8) +0,1137 
Ja = 0,206 + 0,02905 9) (k — 19) Ju =0 

Jys = —0,05682 Jg =0 

Ju =0 Jag = 0,1164ya(k — 2) 

Jay = —0,07469. 


Pelo fato de o modelo ser não-linear, a matriz jacobiana não é constante. 
A fim de calcular autovalores para Jsos, é necessário atribuir valores para 
va(k — 8), yi(k — 19) e ya(k — 2). Esses valores são tomados do conjunto 
de dados medidos. Isso corresponde a linearizar a dinâmica do sistema 
respiratório no ponto determinado por tais medições. Ao fazer isso ao longo 
de todo o conjunto de dados e calculando-se os autovalores, obteve-se a 
Figura 16.38. 
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FIGURA 16.38: Análise de estabilidade de respiração 
O gráfico superior é a série SOS completa. A janela indica- 
da pelas linhas pontilhadas corresponde aos dados obtidos pa- 
ra se obter o modelo (16.29)-(16.31). Em (b) mostra-se o 
histograma do número de modelos para os quais se verificou 
max(| eig(JBos) |) > 1,002. As janelas correspondentes à apnéia 
ou apnéia intermitente são correspondidas por um maior núme- 
ro de modelos com autovalores instáveis das respectivas matrizes 
jacobianas (AGUIRRE; SOUZA, 2004). 


16.8 Dados de Freqgiiência Cardíaca 


À semelhança da última seção, na presente analisam-se dados fisiológicos. 
A série temporal analisada aqui é uma série de freqiiência cardíaca. Essa 
variável é obtida a partir do sinal do eletrocardiograma (ECG). Uma variável 
relacionada é a variabilidade da fregiiência cardíaca (VFC) que é obtida 
como o inverso do período entre batimentos, após removida a média do 
sinal. Além disso, é comum usar técnicas de interpolação para obter-se um 
sinal com período de amostragem constante, 

O tempo entre batimentos cardíacos consecutivos não é constante, nem 
mesmo quando o indivíduo está em repouso, Por motivos que não cabe aqui 
discutir, essa variação dos intervalos entre batimentos cardíacos traz em si 
informação importante sobre o sistema cardiovascular. Consegiientemente, 
o estudo de sinais correlatos, como é o caso do sinal de VFC, tem sido alvo 
de pesquisas recentes, 
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No caso dos dados discutidos na presente seção, a série foi coletada 
de um rato Wistar macho e pré-processada por GUIMARÃES (1996) e, em 
trabalhos posteriores, modelada e analisada (GOMES, 2001; GOMES et al., 
2000). A série resultante do pré-processamento é constituída de 256 valores 
eqiiidistantes de 250 ms e é mostrada na Figura 16.39. 
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FIGURA 16.39: Série de fregiiência cardíaca 


Série de fregiiência cardíaca de rato Wistar. Esta série foi obtida 
a partir do eletrocardiograma e possui 256 valores eqiiidistantes 
de 250ms (GUIMARÃES, 1996). 


O objetivo aqui é tentar obter um modelo, possivelmente não-linear, 
para predizer a série de freqiiência cardíaca e verificar qual é o horizonte de 
predição que se consegue atingir com o respectivo modelo, 

O procedimento seguido foi o seguinte (GOMES, 2001): definiu-se que 
seriam utilizados os primeiros 200 valores como dados de identificação, dei- 
xando os restantes 56 valores para proceder a validação do modelo, bem 
como avaliar o horizonte de predição conseguido. O grau de não-linearidade 
máximo foi £ = 2. Isso quer dizer que modelos lineares são uma subclasse 
dos modelos considerados e, caso os dados sejam lineares, o algoritmo ERR, 
que faz a escolha dos termos regressores de forma automática, escolheria 
termos lineares, Valores superiores do grau de não-linearidade não resulta- 
ram em melhoras, mas significativamente aumentaram o tempo computa- 
cional; assim sendo, escolheu-se £ = 2. O máximo atraso considerado foi 
ny = 25. Portanto, o algoritmo ERR foi utilizado para escolher os melhores 
regressores dentre todos os candidatos de grau de não-linearidade até 2 e 
com atrasos até 25. Utilizou-se um modelo de ruído (MA) simples do tipo 
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cE(k=1) + oE(k—2). Os parâmetros foram obtidos utilizando-se o estima- 
dor EMQ, descrito na Seção 7.2. Procedendo-se dessa maneira, portanto, 
obtiveram-se diversos modelos, dentre os quais mostra-se o seguinte: 


v(k) = 5,6490 + 5,3837x 10-y(k — 1)2 — 0,99589 y(k — 3) 
+1,6285x 10-2y(k — 17)y(k — 19) + 9,1389x 10-2y(k — 18)y(k — 19) 
+5,2445x 102y(k — O)y(k — 20) — 0,27424 y(k — 20) 
+0,17339 y(k — Dy(k — 3) — 0,11129y(k — 1)y(k — 19) 
—4,5462x 10-2y(k — 11)y(k — 25) + 9,1746x 10-2y(k — 9)y(k — 25) 
—4,7947x 10"2y(k — 23)y(k — 25) + 0,16451 E(k — 1) 
+9,496x 10-2E(k — 2) + E(k), (16.33) 


sendo que a parte média móvel (MA) do modelo não foi utilizada nas predi- 
ções mostradas nas Figuras 16.40a,b. Vale a pena observar que o primeiro 
termo do modelo, o termo constante, corresponde à média das primeiras 200 
observações, que são as que foram utilizadas na identificação do modelo. As 
Figuras 16.40a,b mostram, respectivamente, a predição livre e a predição 
de um passo à frente do modelo (16.33). 

Observando-se a Figura 16.40, percebe-se que o modelo (16.33) prediz 
as oscilações devidas às flutuações na fregiiência cardíaca com alguma difi- 
culdade. Por outro lado, o modelo é fiel ao representar o sinal de fregiiência 
cardíaca como flutuando, sendo que as flutuações indicadas pelo modelo 
estão em fase com as flutuações observadas. Isso significa que o modelo 
é capaz de indicar os instantes em que a fregiiência passa por máximos e 
mínimos locais. 

Deve ser notado que o modelo (16.33) é autônomo, ou seja, esse modelo 
não tem entradas, As oscilações mostradas na Figura 16.40a são produzidas 
pelo modelo de forma autônoma e não são consegiiência de uma perturba- 
ção externa. É sabido que a predição de sinais de fregiência cardíaca ou 
sua variabilidade não é tarefa simples, De fato, há indícios de que em certas 
situações tais sinais nem sequer são determinísticos, e em tais casos a pre- 
dição não é possível. Em outras situações, como a considerada na presente 
seção, acredita-se que as flutuações são provocadas por fenômenos deter- 
minísticos e, portanto, passíveis de serem preditos, bem como por causas 
puramente aleatórias (GOMES et al,, 2000). 

Modelos autônomos no estudo da VFC em geral não são adequados 
para simulações de médio prazo (alguns segundos) e longo prazo (minutos 
e até horas), uma vez que divergem ou acabam convergindo para regimes 
dinâmicos mais simples do que o real, tais como o comportamento periódico. 
Uma alternativa para a obtenção de modelos não-autônomos é sintetizar 
sinais hipotéticos, mas consistentes com as observações, e utilizá-los como 
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sinais de entrada. Assim, os modelos obtidos serão aproximações dinâmicas 
entre um sinal de entrada sintético e o sinal de VFC obtido do ECG do 
paciente. Oliveira (2002) apresentou um estudo preliminar do uso de alguns 
tipos de sinais sintéticos para o fim descrito acima. 
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FIGURA 16.40: Predições da série de fregiência cardíaca 

Predições do modelo (16.33) da série de frequência cardíaca 


(a) predição livre e (b) predições de um passo à frente. O traço 
contínuo são os dados de VFC e o tracejado indica as predições. 


A Figura 16.41 ilustra o desempenho de um modelo não-linear não- 
autônomo obtido a partir de dados reais. Tal modelo é uma rede neural 
multicamadas com três neurônios na única camada escondida (OLIVEIRA, 
2002). O vetor de entradas da rede é composto por y(k — 1),... sy(k — 17), 
u(k — 1),... ,u(k — 12) e E(k — 1),... ,E(k — 10), sendo E(k) o resíduo no 
instante k. O sinal de entrada usado foi 


u(k) = 0,047 sen(270,220 KT;) + 0,042 sen(270,046 KT;), 


em que 7; = 1,258. Tanto a fregliência quanto a amplitude das funções seno 
foram escolhidas a partir de uma análise espectral do sinal sendo modelado. 
A motivação básica para isso é prover, via sinal de entrada, algumas das 
carcterísticas principais observadas no sinal de saída, O modelo não-linewr, 
nesse caso, fica responsável por determinar a distribuição de potência espec- 
tral das fregiências do sinal de entrada para as faixas de frequência em que o 
sinal medido apresenta potência espectral. Evidentemente, essa transfurôn- 
cia de potência entre frequências só pode acontecer no contexto de modelos 
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não-lincares. Ou seja, se o modelo ajustado fosse linear, o sinal de saída 
seria periódico e teria potência espectral exclusivamente nas frequências do 
sinal de entrada, ou seja, em 0,220 Hz e 0,046 Hz, 

O traço superior na Pigura 16.41 é uma janela de dados oriundo do ECG 
medido e o traço inferior é uma janela de dados obtidos por simulação do 
modelo identificado. O sinal sintético apresenta um padrão de oscilações 
muito próximo ao do sinal real, 


] so 100 150 200 250 300 
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Figura 16.41: Síntese de intervalos RR por meio de modelos 
Em (a) tem-se um sinal, composto de intervalos RR, obtido a 


partir de um ECG real, e (b) um sinal sintético obtido por modelo 
identificado (OLIVEIRA, 2002). 


16.9 Flotação em Coluna 


Esta seção descreve a identificação não-linear multivariável de uma planta 
piloto de flotação em coluna. Na seqliência serão descritos a planta piloto, 
os testes realizados, os modelos obtidos e a respectiva validação (SARAIVA, 
1999). 


16.9.1 A planta piloto 


A presente seção usa dados coletados durante testes numa planta piloto de 
tratamento de minérios pertencente à Supervisão de Processos do Centro 
de Desenvolvimento de Tecnologia Nuclear (CDTN) em Belo Horizonte. 
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A flotação é um processo de filtragem pelo qual diferentes partículas 
minerais são separadas. Tal separação se faz com o uso de reagentes que 
tornam determinadas partículas hidrofílicas, ao passo que outras ficam hi- 
drofóbicas. No corpo da coluna existe ar, que é injetado na base da mesma. 
Esse ar sobe pelo corpo da coluna e arrasta consigo as partículas hidrofó- 
bicas, deixando para trás as hidrofílicas. No topo da coluna, em função 
dos reagentes, forma-se uma camada de espuma cuja altura é de grande 
relevância para a correta operação da mesma, Outra variável importante é 
a fração volumétrica, na seção central da coluna — chamada de seção de 
concentração, ocupada pelo ar injetado. Essa variável é chamada de hold 
up. Evidentemente, há diversas outras variáveis importantes na operação 
de uma coluna de flotação, mas é comum, para garantir uma boa operação 
desse processo mineral, controlar o hold up e a altura da camada de espuma. 

A planta piloto é formada por um tubo de acrílico transparente com 
duas polegadas de diâmetro e 7,20m de altura. Perto da base da coluna, 
ar é injetado livre de contaminações, devido a partículas sólidas ou óleo. 
A vazão desse ar será uma das entradas dos modelos, como será discutido 
posteriormente. Na seção central da coluna é bombeada a polpa de minério, 
que é basicamente pó de minério misturado com água e certos reagentes 
químicos. Finalmente, no topo da coluna é jogada água utilizada para 
“lavar” o material que deixa a coluna. Esse material é chamado de flotado. 
No caso em que a coluna é usada para retirar a sílica do minério, o flotado é 
a sílica e o minério é o não flotado. Essas são basicamente as duas matérias 
que saem da coluna. No topo, por transbordo, sai o flotado, e na base da 
coluna o não flotado é bombeado para fora. 


16.9.2 Os testes 


Antes de descrever os testes, é importante decidir quais variáveis serão usa- 
das como entradas para os modelos e quais variáveis serão as saídas. Em 
função da operação da coluna, bem como da instrumentação disponível, 
decidiu-se usar como variáveis de entrada as seguintes: velocidade da bomba 
de não flotado, uy (k), vazão de água de lavagem, u2(k), e vazão de ar us(k). 

Com relação às variáveis de saída, o ideal seria ter um modelo que for- 
necesse como saídas a altura da coluna de espuma e o hold up. Infelizmente, 
tais variáveis não são medidas diretamente com facilidade e precisão, Ao 
invés, é comum medir a pressão em dois pontos distintos da coluna, na 
seção de concentração, À princípio, é possível inferir a altura da camada 
de espuma e o hold up à partir dos valores de tais pressões. Há diversas 
formas de se fazer isso, e o desempenho dos métodos disponíveis é variado, 
Sendo assim, decidiu-se não entrar no mérito de qual seria a melhor forma 
de estimar a altura da camada de espuma e o hold up e simplesmente obter 
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modelos cujas saídas sejam os valores de pressão nos dois pontos da coluna, 
que são medidos (SARAIVA, 1999), 

Foram realizados dois testes em dias distintos, mas em condições de 
operação semelhantes: vazão constante a 1.230ml/min com concentração 
de flotanol a 12ml/min, 1%. Os sinais de entrada de velocidade da bomba 
de não flotado e vazão de água de lavagem foram gerados usando-se um 
gerador de números aleatórios e mantendo-se constante cada valor assim 
obtido por 4 minutos, como pode ser visto na Figura 16.42. Essa duração 
mínima dos patamares foi determinada como sendo aproximadamente 33% 
da constante de tempo mais rápida da coluna observada durante testes ao 
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FIGURA 16.42: Teste em planta piloto de flotação em coluna 
Sinais de entrada de um dos testes na planta piloto de flotação 
em coluna. (a) velocidade da bomba de não flotado (w(k)), 
(b) vazão da água de lavagem (ua(k)) e (c) vazão de ar (us(k)). 
Os primeiros 80 segundos foram usados na identificação dos mo- 
delos, 


Finalmente, o sinal de vazão de ar não foi manipulado. As variações 
observadas são conseqiiências da linha de ar que serve a diversos processos 
e não apenas à planta piloto de flotação. Uma preocupação importante no 
projeto de sinais de excitação é que tais sinais não sejam correlacionados 
entre si. Nesse sentido, além de gerar os níveis das variáveis u(k) e uz(k) 
de forma independente, tomou-se o cuidado de defasar de dois segundos os 
instantes de mudança entre essas duas variáveis. 
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Os valores de pressão nos dois pontos da coluna, durante o teste em 
questão, são mostrados na Figura 16.43. Em se tratando de pressões em 
dois pontos entre os quais existe uma coluna de polpa com água, reagentes e 
bolhas de ar, é natural que tais pressões sejam fortemente correlacionadas, 
como pode ser constatado na figura. Por outro lado, como a densidade do 
fluido entre as duas tomadas de pressão não é constante, a diferença entre 
as duas pressões não é fixa, 
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FIGURA 16.43: Teste em planta piloto de flotação em coluna 
Sinais de saída de um dos testes na planta piloto de flotação em 


coluna, Pressões da seção de concentração da coluna: (a) ponto 
superior yi(k) e (b) ponto inferior ya(k). 


Os dados foram originalmente coletados a uma taxa de amostragem de 
0,5 Hz. Uma análise posterior, usando o método descrito na Seção 12.2.3, 
revelou que os dados precisavam ser decimados. Usou-se, portanto, um 
fator de decimação de 18, o que resultou num período de amostragem igual 
a Ty = 36 segundos, Sendo assim, cada valor aleatoriamente escolhido para 
os sinais de entrada era amostrado em torno de seis vezes. 


16.9.3 Os modelos 


O seguinte modelo linear foi obtido a partir dos primeiros 80 minutos dos 
ginais mostrados nas Figuras 16,42 e 16.43; 
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w(k) = 0,57796y (6-1) -0,242507) (k—2) + 0,02219y2 (6-4) 
-0,04753 (6= 1) + 1,84570u2(k—1) + 0,1034415 (k—4) 
—0,22832u2(k— 10) —0,0142u, (k— 5) + 0,62499y2 (= 1) 
-0,6052u3 (k— 11) =0,07072y2 (k — 2) —0,085887n (k— 4) 
+0,08193u3 (k — 12) —0,42089us (k — 5) — 0,06044u3 (k— 8) 
+0,16549y (k— 5) 

Walk) = 1,4422yo(k-—1)-0,05506y2 (k—2) + 0,26302u3 (k—7) 
-0,05089u (k— 1) + 2,0125u2(k—1)—0,02416u2 (k—7) 
-0,40571y (k— 1) + 0,07807ua (k— 15) —0,22593u2(k—3) 
-0,60516us(k— 11) -0,51117u2 (k— 10) + 0,70885uo(k—11) 
-0,04743uo (k— 8) —0,57584u2 (k— 13) + 0,07574us(k—4) 

“0, 11753us(k—1), (16.34) 


sendo que para cada equação deste modelo foi usada uma parte MA de 41 
termos de ruído para reduzir o efeito de polarização durante o procedimento 
de estimação de parâmetros. 

A fim de validar o modelo (16.34), foi utilizada a segunda parte do 
conjunto de dados mostrados nas Figuras 16.42 e 16.43, ou seja, os primeiros 
80 minutos foram usados para identificar modelos, sendo que para validar 
o modelo foi utilizada a janela de dados compreendida entre os minutos 73 
e 110. Os valores de pressão preditos pelo modelo (16.34) são mostrados 
na Figura 16.44. Ressalta-se que os resultados são de predições livres e 
não predições de um passo à frente. Portanto, na Figura 16.44 mostram-se 
predições da ordem de meia hora. Evidentemente, o modelo (16.34) parece 
acompanhar muito bem as flutuações das pressões da seção de concentração 
da coluna. 

O procedimento de validação utilizando a última parte de um conjunto 
de dados é bastante comum, principalmente quando não é possível a 
realização de mais de um teste em condições de operação próximas. No | 
presente caso, entretanto, foi possível fazer outro teste, totalmente inde- | 
pendente, em outra época. O desempenho do modelo (16.34) na predição | 
desse segundo conjunto de dados é mostrado na Figura 16.45. | 
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Figura 16.44: Validação de modelo linear multivariável 


Validação do modelo (16.34): (—) dados medidos e (——) as pre- 
dições do modelo. Pressões da seção de concentração da coluna: 
(a) ponto superior yy(k) e (b) ponto inferior ya(k). 
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FIGURA 16.45: Validação de modelo linear multivariável 


Validação do modelo (16.34) usando-se dados obtidos a partir 
de um teste independente; (—) dados medidos e (==) as predi- 
ções do modelo, Pressões da seção de concentração da coluna: 
(a) ponto superior yy (k) e (b) ponto inferior ya(k). 
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Analisando-se a Pigura 16.45, pode-se concluir que o modelo (16.34) de 
fato parece ter, em termos gerais, capturado a dinâmica do processo. Deve 
ser notado que os dados da Pigura 16.45 correspondem a duas horas de vida 
da planta piloto. À semelhança da Figura 16.44, mostra-se o resultado da 
predição livre do modelo (16.34). Comparando-se o desempenho do modelo 
em ambos os conjuntos de dados de validação, conclui-se que os erros má- 
ximos de predição cometidos na Figura 16.44 são bem menores (abaixo de 
1kPa) do que os correspondentes na Figura 16.45, onde alguns trechos che- 
gam perto de 2kPa. Uma possível razão para isso é o fato da planta piloto, 
como todo processo real, ser variante no tempo. Na prática, isso quer dizer 
que entre o primeiro teste (ver Figura 16.43) e o segundo (ver Figura 16.45) 
ocorreram mudanças na condição de operação da planta. Como o modelo 
foi obtido a partir dos dados das Figuras 16.42 e 16.43 apenas, tal modelo 
já estava “desajustado” quando da realização do segundo teste. São tais 
situações que motivam o uso de técnicas recursivas de estimação, como as 
apresentadas no Capítulo 8 e ilustradas nas Seções 16.6 e 16.11. 

A partir do mesmo conjunto de dados, foram obtidos modelos não- 
lineares (SARAIVA, 1999), um dos quais é mostrado a seguir: 


n(k) = 0,63647y(k—1)+0,024364yn(k—2)+0,020431us(k— T)ya(k— 4) 
—6,7078x 10"us(k— 11)w (k—1)+1,1323x 10-2us(k— 19)u) (k—2) 
—4,4909 x 10"*ua(k— 13)us (k— 5) +0,62576us(k— 15)ua(k—1) 
—5,7725x 10“w (k— 2)u(k—1)—0,85046ua(k— 19)us(k—7) 
+0,17118us(k — 8) us(k— 4) +5,2205x 10?yo (k— 1)? 

+2,3385x 10º, (k— 4)us (k— 2) — 1,1447 x 10us(k— 2)uy (k— 5) 
1,0972ya(k— 1) —0,02396ya(k— 2) — 2,8803 x 10-u, (k— 1) (k— 2) 
+0,15428u2(k — 1)yn (k— 3) —0,04017us(k— 12)us(k—11) 
—0,6411Gua(k — 10)ua(k—3) —2,4690 x 10us(k = 17)u (k—5) 
+0,77827uo(k— 1 ua (k— 8) +0,10517us(k— 9)us(k=7) 
-1,0897u2(k— 13)ua(k— 7) —4,0773x 10-u, (k— 4)yi (k— 2) 
+0,32941ua(k — 13)u2(k—3) = 0,01302u5(k— 1)y, (R— 1), (16.35) 


va(k) 


sendo que para cada equação do modelo acima foi usada uma parte MA de 
41 termos de ruído para reduzir o efeito de polarização durante o procedi- 
mento de estimação de parâmetros, O grau de não-linearidade do modelo 
(16.35) é £ = 2, O aumento do grau de não-linearidade não resultou em 
melhoras apreciáveis. O modelo (16,35) tem 13 termos em cada subsistema, 
sendo que tais termos foram automaticamente selecionados pelo algoritmo 
ERR descrito no Capítulo 11 dentre um conjunto de 1.596 termos can- 
didatos. Por outro lado, o modelo (16.34), que tem 16 termos em cada 
subsistema, foi composto usando-se o algoritmo ERR, mas o conjunto de 
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termos candidatos era de apenas 46 regressores. Este exemplo ilustra uma 
das grandes diferenças que existem entre a identificação linear e não-linear. 
Nesta, o número de possibilidades na determinação da estrutura dos mo- 
delos é imensa e algoritmos sofisticados e eficientes precisam ser utilizados 
para escolher a estrutura mais adequada para modelar um determinado 
conjunto de dados. 

Finalmente, na Figura 16.46 mostra-se o desempenho do modelo (16.35) 
na predição livre do conjunto de dados obtidos durante o segundo teste. O 
desempenho de forma geral é muito bom, especialmente durante os primei- 
ros 90 minutos do teste. 
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FIGURA 16.46: Validação de modelo não-linear multivariável 


Validação do modelo (16.35) usando-se dados obtidos a partir 
do segundo teste: (—) dados medidos e (-—) as predições do 
modelo. Pressões da seção de concentração da coluna: (a) ponto 
superior q (k) e (b) ponto inferior ya(k). 


16.10 Série Temporal de Preços 


Nesta seção será estudada uma série temporal de preços usando-se técnicas 
de identificação de sistemas. O sistema em estudo é o setor produtivo 
de carne bovina do Estado de São Paulo, cujo rebanho está estimado em 
aproximadamente 12 milhões de cabeças. O produto final é a carne de boi. 

Os dados a serem analizados correspondem a valores mensais médios 
dos preços recebidos pelos produtores no Estado de São Paulo. A série 
temporal cobre o período de março de 1954 a dezembro de 1995 e apresenta 
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freqiiências devidas ao ciclo reprodutivo do gado (aproximadamente de 6,8 
anos), à sazonalidade e diversas harmônicas (AGUIRRE; AGUIRRE, 1999), 
conforme mostrado na Figura 16.47. 


100) ——— 


so DSI ;DS-m | 


1955 1960 1965 1970 1975 1980 1985 1990 1995 
ano 


FIGURA 16.47: Série temporal de preços 


Série temporal de preços de “boi gordo” de março de 1954 a 
dezembro de 1996 (AGUIRRE; AGUIRRE, 2000). 


A série temporal mostrada na Figura 16.47 ilustra o tipo de complexida- 
de encontrada em séries de preços. Os dados são publicados pela Secretaria 
da Agricultura do Estado de São Paulo. Os preços foram corrigidos para 
eliminar os efeitos da inflação usando-se o índice de preços IGP/DI estima- 
do pela Fundação Getúlio Vargas (FGV). De acordo com Mueller (1987), 
a tendência crescente no período 1954-1979 foi o resultado do aumento de 
demanda ocasionado pelo aumento econômico, crescimento esse que não foi 
acompanhado pela oferta de carne. Por outro lado, a tendência decrescente 
iniciada por volta de 1980 pode ser explicada por diversos fatores. Do lado 
da oferta, houve melhoras significativas em tecnologias que influenciaram 
diretamente o processo produtivo. Por outro lado, do ponto de vista da 
demanda, houve uma significativa queda no poder aquisitivo dos consumi- 
dores como conseqgiiência da recessão econômica no período de 1981 a 1984. 
Durante esse período em que houve queda no preço real da carne, ocorreu 
uma importante intervenção do governo em 1986 durante a implementação 
do Plano Cruzado. Naquela ocasião, além da mudança da moeda, houve o 
congelamento de preços ao fim do mês de fevereiro, um mês em que, devido 
à sazonalidade, o nível do preço da carne de boi é tipicamente baixo. Seis 
meses depois, as pressões do mercado e diversos outros fatores causados 
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pelo plano de estabilização econômica culminaram nos valores mais altos 
observados em toda a série. 

Deseja-se, nesta seção, analisar os dados da Figura 16.47 usando-se 
modelos auto-regressivos autônomos, ou seja, sem entradas. A fim de fazer 
isso, foi seguido o seguinte procedimento. Uma janela de dados correspon- 
dente ao período 1954 a 1967 foi escolhida e será chamada de DS-I. Após 
retirar a tendência linear dessa janela de dados, uma família de modelos 
auto-regressivos e média móvel (ARMA) foi obtida. Ao obter tais modelos, 
não foram impostas restrições quanto à linearidade dos modelos, de manei- 
ra que modelos não-lineares e lineares seriam considerados na análise. Um 
regressor típico dos modelos considerados pode ser descrito como 


ulk — h)Py(k — )y(k — 5)", (16.36) 


sendo h,i,j =1,..-5(=ny);pmr=0,...3ep+qg+r < 3=). Deve ser 
notado que se quaisquer duas variáveis entre p,q e r forem zero e a terceira 
for igual a um, então o regressor é linear. Portanto, o conjunto de modelos 
lineares AR até a ordem 5 é um caso especial pertencente à família de 
modelos considerada. Além disso, cinco termos de resíduos foram incluídos 
(parte média móvel) para reduzir o efeito de polarização. 

Usando cada um dos modelos foram obtidas predições de seis passos à 
frente (ver Seção 13.2) ao longo de diversas janelas. O objetivo era verificar 
se a família de modelos, em princípio representativas da dinâmica do período 
entre 1954 e 1967, é adequada para caracterizar a dinâmica de alguma outra 
janela de dados, uma vez que desde 1954 o “sistema” passou por diversas 
mudanças significativas. A fim de permitir a comparação do desempenho 
dos modelos obtidos, utilizou-se o seguinte índice: 


N 
TN okp50) = 55 | u(k) — 9(kpoD) |; (16.37) 
i=1 


sendo que o horizonte de predição kp nesta seção é de seis meses, Portanto, 
D(kp;d) indica predições de seis passos à frente. Os principais resultados 
são mostrados na Figura 16.48, em que cada número inteiro no eixo das 
abcissas corresponde ao número de regressores do modelo correspondente. 
A partir da análise da Figura 16.48 torna-se evidente que a família de 
modelos prediz a janela de dados DS-II melhor do que as demais. Isso 
não é uma surpresa, pois, historicamente, o período correspondente a DS-II 
está mais perto do período correspondente a DS-I que os demais períodos. 
Logo, é razoável esperar que a dinâmica correspondente à janela DS-II seja 
semelhante à da janela DS-I e, portanto, a predição de DS-II usando modelos 
obtidos a partir de DS-I deveria ser melhor do que para as demais janelas. 
Esse cenário ocorre devido à não-estacionariedade dos dados. Se a série 
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temporal fosse estacionária, seria de esperar que o desempenho dos modelos 
fosse basicamente o mesmo, independentemente do período considerado. 


Figura 16.48: Índice de qualidade de modelos para uma série de preços 


Índice de qualidade (16.37) de uma família de modelos com um 
número crescente de termos (indicado no eixo das abcissas) e cal- 
culado ao longo de diversas janelas: (—) abril de 1968 a fevereiro 
de 1972, DS-II; (- -) março de 1972 a janeiro de 1976, DS-III; 
(::-) março de 1988 a janeiro de 1992, DS-IV; (— : —) fevereiro 
de 1992 a dezembro de 1995, DS-V; (AGUIRRE; AGUIRRE, 2000). 


Modelos com até 12 termos predizem DS-V bem. Modelos com 13 a 
16 termos revelam dificuldades na predição, mas após a inclusão do décimo 
sétimo termo o modelo se torna instável, devido a problemas de sobrepara- 
metrização. Modelos com até 5 termos predizem DS-IV com dificuldades e 
se tornam instáveis quando o sexto termo é incluído. Apenas modelos com 
1 e 2 termos são estáveis na predição de DS-III. 


A Figura 16.48 revela que a família de modelos também prediz a janela 
de dados DS-V muito bem, pelo menos para modelos até 12 termos, apesar 
de corresponder ao período cronologicamente mais afastado de DS-I. Por- | 
tanto, parece razoável inferir que a dinâmica subjacente à janela de dados 
DS-II e DS-V está próxima à dinâmica do período considerado para a iden- 
tificação dos modelos, janela DS-I. 
] 


Antes de encerrar esta seção, deseja-se chamar a atenção para o fato 
de que a Figura 13.4, apresentada na Seção 13.2, mostra as predições do 
seguinte modelo de 5 termos: 
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ylk) = 1,0646y(k — 1) — 61,0456y(k — Dy(k — 2)y(k — 4) 
—0,0064y(k — 1)º + 33,5534y(k — 2)y(k — 3)y(k — 5) 


5 
=6,7291y(k — 5) + S Elk — 1) + €(h), (16.38) 


i=l 


estimado na janela DS-I. O somatório indica a parte MA do modelo que 
no presente exemplo foi usada apenas para reduzir o efeito da polarização, 
conforme mostrado no Capítulo 7. Tal parte do modelo não foi usada no 
cálculo das predições. 

A presente seção ilustrou não apenas como modelos auto-regressivos 
podem ser utilizados para fazer predições de uma série de preços, mas 
também como tais modelos podem ser usados para avaliar característi- 
cas dinâmicas de diversos períodos de tempo cobertos pela série temporal 
considerada. 


16.11 Estimação de Parâmetros de Máquina de 
Indução 


Um problema importante no controle de acionamento de máquinas de in- 
dução é a estimação recursiva dos parâmetros da máquina. Em função da 
importância do problema, há diversas técnicas disponíveis. Os resultados a 
serem mostrados na presente seção foram obtidos utilizando-se o modelo em 
tempo contínuo da máquina de indução e o estimador recursivo de mínimos 
quadrados (OLIVEIRA, 1998). 


16.11.1 O modelo contínuo 


O ponto de partida é derivar a estrutura matemática do modelo do motor 
de indução e localizar nessa estrutura os parâmetros que se deseja estimar. 
Uma forma de expressar o modelo da máquina de indução é a seguinte: 


dis 1 no. E A ) 1 
EE q aê =m = pão o fi ntó 
dt oLs (nt na Sd ln) MT Eça 
dA, Li 1 or) 
et EE dl A 
dE E is + ( a + jwr ) Ar 
S LsL, — Lm 
SN [277º 
A 
ça = (16.39) 
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sendo que o subíndice “s” indica grandezas do estator e “r” grandezas do 
rotor. v indica tensão elétrica, i corrente elétrica e À o fluxo. Re L indicam, 


respectivamente, a resistência elétrica e a indutância. 

A seguir, o modelo (16.39) será colocado na forma y = Vô, a fim de 
poder aplicar os métodos estudados nos Capítulos 5 a 8 na estimação re- 
cursiva dos parâmetros do modelo da máquina. Para isso, é importante 
perceber que na matriz de regressores devem aparecer grandezas que pos- 
sam ser medidas ou estimadas com facilidade. Uma alternativa é o modelo 
corrente-tensão (JACOBINA et al., 1996): 


às + axis + aois = byús + boys, (16.40) 
sendo s EA o 
eq= oLs Nr db 
a = Pole+ Roda 
à Sold 
of 
db = sx (g sa) 
1 
dh = 


O modelo mostrado na Eq. 16.40 pode ser representado em forma ma- 
tricial, como se segue: 


[a] [Pe ag [| Elle 


Dê ET CET) 


que, por sua vez, pode ser colocada na forma y = Vô, sendo 


gi 


y = [cia isa is cia Ud Ud tg | (16.42) 
—tsq tsd —tsq isd Usd Vsq —Usd 
RaLy+RiLy LA Eli ds 1 
[ old. Wet gl ur ol; als writ ] : 


Se o sinal de velocidade w, for conhecido, ? é possível reescrever o modelo 
da máquina, ainda na forma y = Vô, mas agora com (OLIVEIRA, 1998): 


2É comum medir essa variável. 
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-ig =isq Wrisd Úsd — WrUsd Vsq 


T 
Palotdulo Rol, = de di A 
oLsLr aLlsm ols ols ol | 


v = E- —isd —uwrisq Úsd + WrUsq | (16.43) 


Finalmente, os parâmetros do motor o Ls, Tr, Rs é Ls podem ser estima- 
dos da seguinte forma: 


md 
[7 
te = PR 
d d 
E [> 
= oQ- 
He à 
Ls = oi (1-5) (16.44) 
oLs 


sendo que Ô; é o i-ésimo elemento do vetor estimado ô. Deve ser notado que 
o produto oLs é estimado sendo o inverso de 04. Não é possível estimar o 
e Ls separadamente, de forma direta, usando-se a presente parametrização. 


16.11.2 Os dados 


O motor de indução, objeto da presente seção, foi conectado em triângulo 
para a execução de dois tipos diferentes de ensaio, a saber, i) partida direta 
da rede trifásica e ii) partida utilizando um inversor, mantendo a relação 
entre a tensão e a fregiência (V/f) constante (OLIVEIRA, 1998). Foi usado 
um período de amostragem fixo igual a T; = 250 us, um fator de esqueci- 
mento unitáro, À = 1, e as derivadas foram calculadas usando-se o proce- 
dimento descrito no Complemento 10.2, com cinco pontos por janela. A 
seguir, são mostrados alguns resultados para a partida usando inversor com 
V/f constante. 


16.11.3 Estimação recursiva de parâmetros 


A Figura 16.49 mostra a tensão e corrente em eixo direto, bem como a 
velocidade angular da máquina durante o primeiro segundo do teste. 
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FIGURA 16.49: Tensão, corrente e velocidade de motor 


(a) tensão vsa em volts e (b) corrente isa em amperes, ambos 
em eixo direto, e (c) velocidade angular em rotações por minuto. 
Valores medidos durante o primeiro minuto de teste. 


º 01 oz 03 04 05 08 o 08 os 1 
1) 


FIGURA 16,50: Sinais de derivadas 


Derivadas de (a) tensão, dsa, (b) corrente isa, ambos em eixo 
direto, e (c) derivada segunda de corrente isa. 


Por outro lado, a Figura 16.50 mostra a derivada primeira do sinal de 
tensão e de corrente mostrados, respectivamente, na Figura 16.49a,b, bem 
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como a derivada segunda da corrente em eixo direto. Evidentemente, os 
respectivos sinais para o eixo em quadratura também foram calculados, mas, 
por serem qualitativamente equivalentes aos mostrados nas Figuras 16.49 
e 16.50, são omitidos. 


É importante notar que os sinais mostrados nas Figuras 16.49 e 16.50 
são necessários para compor o vetor y e a matriz W em (16.43), a fim de 
proceder à estimação de parâmetros. Em outras palavras, os regressores são 
compostos por tais sinais. 


A Figura 16.51 mostra os valores recursivamente estimados dos pará- 
metros o Ls, Rs, Ls e ?; durante dois segundos de teste. Ressalta-se que os 
parâmetros foram inicializados com valores nulos e o valor inicial da matriz 
de covariância do estimador foi 1041, sendo 1 a matriz identidade. 


Na Figura 16.51, os valores constantes correspondem a valores dos pa- 
râmetros estimados por ensaios clássicos e são mostrados apenas como refe- 
rência, uma vez que tais valores estão sujeitos a diversas incertezas. Pode-se 
notar que, à exceção de ts, os demais parâmetros parecem ter convergido 
após dois segundos. 


o [x 


e 15 2 o os 

us) 

FIGURA 16.51: Parâmetros estimados de uma máquina 
Parâmetros recursivamente estimados a partir dos sinais mostra- 
dos nas Figuras 16.49 e 16.50. (a) oLs, (b) Rs, (c) Ls e (d) %. 
Dois segundos de teste são mostrados. Os valores constantes 


correspondem a valores dos parâmetros estimados por ensaios 
clássicos. 
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to) 


o 005 91 015 02 025 


s 151 1,52 1,53 1,54 1.55 1,56 


Figura 16.52: Dados medidos e simulados 
Corrente “medida”, isa, é calculada com o modelo, isa, usando-se 


os parâmetros recursivamente estimados. (a) regime transitório 
e (b) regime permanente. 


Ainda com relação à estimação de parâmetros, ressalta-se que sete ter- 
mos de resíduos foram acrescentados à equação y = Yô (ver Eq. 16.43), a 
fim de reduzir o efeito de polarização. O algoritmo utilizado nesse caso foi 
o estimador recursivo EMQ. A inclusão desses termos de resíduo teve um 
efeito importante no desempenho do estimador recursivo (OLIVEIRA, 1999). 

Finalmente, a Figura 16.52 mostra o desempenho do modelo usando os 
parâmetros estimados recursivamente, tanto em regime transitório quanto 
em regime permanente. De forma geral, o modelo aproxima bem os dados 
de corrente, Deve ser notado que o que se mede é um conjunto de correntes 
trifásicas a partir das quais, após uma transformação, chega-se às correntes 
“medidas” em eixo direto e quadratura. Tais correntes são estimadas pelo 
modelo. 


16.12 Microrrobôs Móveis 


Os resultados apresentados na presente seção diferem dos das demais seções 
em pelo menos dois aspectos, Em primeiro lugar, a estrutura do modelo 
multivariável identificado foi escolhida baseando-se em conhecimento prévio 
do sistema, portanto, caracterizando um procedimento de identificação do 
tipo caixa cinza. Na Seção 16.11 o procedimento para determinar a matriz 
de regressores foi basicamente o mesmo, porém, naquela seção o objetivo 
não era identificar um modelo, mas estimar os parâmetros de uma máquina 
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de indução. Em segundo lugar, discute-se como o modelo identificado foi 
usado no projeto de um sistema de controle (PEREIRA, 2000). 

O sistema completo compreende um conjunto de seis microrrobôs obser- 
vados por um sistema de visão que informa a um computador tipo PC as 
posições dos robôs que são divididos em dois times. De posse das posições 
relativas dos robôs e suas velocidades estimadas, um programa rodando no 
PC determina como é que o seu time deve se mover a fim de atingir os 
objetivos predefinidos. Cada robô tem dois motores (DC a ímãs permanen- 
tes), sendo que cada um aciona uma das rodas do robô. Na presente seção, 
descreve-se a identificação de um desses robôs a partir dos dados de entrada 
e saída. 

No sistema em estudo, o controlador, que roda no PC, determina duas 
ações de controle ui (k) e uz(k) que são usadas para acionar os dois motores 
do robô (CAMPOS et al., 1998). Se ambos os motores forem absolutamente 
idênticos, ações de controle iguais, u(k) = u2(k), resultariam num movi- 
mento em linha reta. Por outro lado, se uma ação de controle for maior do 
que a outra, o robô passa a se movimentar seguindo um segmento de arco. 
Assim, o movimento do robô pode ser caracterizado acompanhando-se três 
variáveis: posição ao longo dos eixos x e y, que definem o plano de movi- 
mentação do robô, e o ângulo que define a posição rotacional do robô em 
relação ao seu eixo pivotal, 0. Deseja-se, portanto, identificar um modelo 
que forneça essas três variáveis ao longo do tempo em função das ações de 
controle, ou seja, deseja-se um modelo do tipo: 


(lh), u(k), 9(k)) = fe(k=1),9(k-1),0(k=1),m(k-d), va(k-d)], (16.45) 


sendo que d é um atraso puro de tempo, e a indicação (k — 1) do lado 
direito da Eq. 16.45 indica que o modelo usa informação até e incluindo o 
instante k—1 para determinar as variáveis no instante k. Baseando-se nas 
características cinemáticas do robô, escolheu-se a seguinte parametrização 
para o modelo (PEREIRA, 2000): 


ek) = ale(k-1)+aya(k-2) + [bNu(k=d) + bF us(k=d) + dx] x 


10 
x cos(9(k=1)) + D cf Es(k 1) 


i=l 


uk) = aly(k-1)+a? y(k=2)+ [bl w(k=d) + 6! us(k-d) +dY] x 


10 
xsen(B(k=1)) + 5) ci 6,(k — 1) 


i=l 


o(k) = afo(k-1) +05 0(k-2) +69 m(k=d) +69 us(k—d) + dê 


10 
+5 Sbolk=i), (16.46) 


i=l 


Digitalizado com CamScanner 


654 16 EstuDos DE Caso 


sendo que as partes MA são “monovariáveis” no sentido de que elas somente 
incluem termos de resíduo da variável da equação em que se encontram. A 
opção mais geral é usar resíduos de todas as variáveis do modelo em cada 
equação, como mostrado na Eq. 10.58 do Complemento 10.1. Para os fins da 
presente seção, como será visto, a estrutura do modelo (16.46) é satisfatória. 
Finalmente, observa-se que pelo fato de não terem sido removidos os valo- 
res médios dos sinais antes de proceder à estimação de parâmetros, foram 
incluídas as constantes d; na estrutura do modelo. 


A Figura 16.53 mostra os dados que foram utilizados para fazer a identi- 
ficação do robô. Como pode ser observado, os sinais de entrada são as ações 
de controle e, durante o teste, foram escolhidos como sendo sinais binários 
pseudo-aleatórios, conforme detalhado na Seção 4.3, Os sinais de saída, por 
sua vez, são as posições ao longo dos eixos, x e y, bem como a orientação 
angular do robô com relação ao seu eixo pivotal. 


FIGURA 16.53: Dados de identificação de microrrobô 
Dados obtidos durante um teste dinâmico num microrrobô e que 
foram usados na identificação de modelos (prbs10 O). (a) sinais 
de controle usados para acionar os motores (—) u (k), (--) ua(k), 
(b) posição linear ao longo dos eixos (—) ze (- -) y, e (c) posição | 
angular 9 (PEREIRA, 2000). | 


A parte AR de um modelo obtido a partir da estrutura (16.46) e dos 
dados da Figura 16.53 é 


— 
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z(k) = 1,08242(k-1)-0,68242(k=2)+[0,0441 ui (k—8)+0,0403 ua(k —8)) x 
x cos(9(k—1)) 
v(k) = 1,7150y(k-1)-0,7152y(k=2) + [0,0336 u(k—8) +0,0318 u2(k —8)] x 
xsen(9(k—1)) 
o(k) = 1,56400(k—1)-0,5640 0(k—2) -0,0063 ui(k—8)+0,0065 ua(k — 8), 
(16.47) 


sendo que o atraso de oito períodos de amostragem foi estimado a partir 
de testes de resposta ao degrau. À Figura 16.54 mostra as funções de au- 
tocorrelação dos resíduos das três variáveis do modelo (16.47). Como pode 
ser visto não há indícios de que tais resíduos sejam autocorrelacionados, su- 
gerindo, assim, que os parâmetros foram estimados sem polarização. Para 
verificar essa afirmativa de forma mais consistente, seria necessário fazer 
testes de correlação cruzada entre os próprios sinais de resíduos e também 
entre eles e os sinais de controle u;(k) e u2(k), conforme discutido na Se- 
ção 13.4. Simulações livres do modelo também atestam a validade do mesmo 
(PEREIRA, 2000). 


(a) (b) (e) 


FIGURA 16.54: Teste de correlação 


Funções de autocorrelação dos sinais de resíduo (a) Eza(k), 
(b) Eyylk) e (c) Eoo(k). Como pode ser visto, não há indícios 
de correlação na faixa de atrasos considerada, que foi de O a 20 
(PEREIRA, 2000). 


O modelo (16.47) pode ser representado na forma de funções de trans- 
ferência em z, como se segue 
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x(2) 004 UK 27 O0403UH 27 
3 (z — 1)(z — 0,6824) “ (z = 1)(z = 0,6824) 
0,0336 UY” 27? 0,0318UY 277 
Y(o) = aaa + 
(8) = -ifr- 07152) * (z-1)z Oq) (16.48) 
om) = q 0,0065 Up 27 


== =0,5040) * (7 = )(z — 0,560): 


Com relação ao modelo (16.48), é interessante notar que há pequenas 
diferenças entre os ganhos das funções de transferência indicando que os 
motores, como esperado, não influenciam as variáveis Z, y e O de maneira 
idêntica. Na prática, isso quer dizer que se o mesmo sinal de controle for en- 
viado para ambos os motores, o robô não se deslocará em linha reta, como 
desejado no caso de comandos iguais, mas sua trajetória será curvilínea. 
Há, portanto, necessidade de compensar essa diferença entre os motores, 
na configuração de controle adotada. Para isso, é necessário primeiramente 
quantificar a diferença. Tal informação, entretanto, já está disponível no 
modelo uma vez que a diferença entre os ganhos quantifica precisamente 
a desigualdade entre os motores usados (PEREIRA, 2000). Essa compen- 
sação é feita, como mostrado na Figura 16.55, pelo bloco bi /ba, onde tais 
parâmetros foram definidos na estrutura (16.46). 


FiGuRA 16.55: Malha de controle do microrrobô 


Malha de controle do microrrobô. O bloco bi /b é utilizado para 
compensar diferenças entre os motores ao passo que o bloco “pre- 
ditor” é necessário para atenuar o efeito do atraso puro de tempo. 
As informações necessárias para implementar ambos os blocos 
estão contidas no modelo identificado (PEREIRA, 2000). As fun- 
ções Gi(z) e Ga(z) quantificam como os sinais de controle u (k) 
e u2(k) afetam dinamicamente a posição ao longo do eixo y e 
correspondem às duas parcelas do lado direito das Eqs. 16.48. O 
controlador PI D(z) é implementado no PC. O sistema inclui um 
diagrama para o controle de cada uma das variáveis X(z), Y(z) 
e O(z). 
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Outra dificuldade ao se desejar controlar o microrrobô em questão é o 
atraso puro de tempo de oito períodos de amostragem. É bem sabido que 
atrasos em malhas de controle são potencialmente difíceis de se lidar. Uma 
forma de fazê-lo é utilizar um preditor para “anular” o efeito do atraso. Mais 
uma vez, o modelo (16.47) é útil no controle do microrrobô, pois ele pode 
ser simulado em tempo real para fazer a predição e assim compensar o efeito 
do atraso. Assim sendo, o modelo identificado foi utilizado de forma efetiva 
para viabilizar um sistema de controle adequado à topologia escolhida para 
o robô, conforme ilustrado na Figura 16.56. 


tylk) (k+1) 
Ko) =| poolk) XU+D=| xk+1) 
lh), +), 


Controller 
(step 11) 


A+) 
Rú+D=| t+ 
ô+n) 


Vision System 
(step 5) 


x(k-d) 
X(k-d)=| tk-d) 


Ok -d) 


Predictor 
(steps 6-10) 


Figura 16.56: Detalhe da malha de controle do microrrobô 


O modelo (16.47), indicado pelo bloco Predictor, é usado para 
compensar o atraso puro de tempo. Note que o controlador usa a 
informação predita, que é uma aproximação da atual posição do 
robô, ao invés de usar diretamente os valores medidos (PEREIRA 
et al., 2006). 


O procedimento seguido, ilustrado na Figura 16.56, é o seguinte: 


1. faça k=1; 
2. faça u(k) = 0; 
3. sek=2d-1, continue, senão, faça k = k + 1, e volte ao passo 2; 


4. calcule X(k — d) = [z(k — d),y(k — d),9(k — d)] a partir dos dados 
fornecidos pelo sistema de visão e faça k = k + 1; 


5. calcule X(k — d) = [z(k — d),y(k — d),0(k — d)] a partir dos dados 
fornecidos pelo sistema de visão; 
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6. calcule X(k = d+ 1) usando X(k —d), X(k-d-1),u(k-2d+1) e 
o modelo estimado; 


7. calcule R(k — d 42) usando X(k = d+ 1), X(k— d), u(k = 2d+2) e 
o modelo estimado; 


8. faça à = 2; 


9. calcule R(k=d+1+i), A(k=d+i), X(k=d+i-1), u(k=20+1+1) 
e o modelo estimado; 


10. se i = d continue, senão faça i = i + 1 e volte ao passo 9; 


11. calcule as ações de controle u(k) e u2(k) usando a predição X(k + 1) 
e a trajetória de referência Xsp(k). Envie a ação de comando para o 
robô; 


12. faça k = k + 1 e volte ao passo 5. 


Os passos de 1 a 4 são usados para preencher os registros que contêm 
as ações de controle e a posição do robô. O passo 6 é a segunda iteração do 
laço composto pelos passos 5 a 12. Nesse passo, calcula-se a predição de um 
passo à frente utilizando-se para isso os dados fornecidos pelo sistema de 
visão (coletados no passo 5) e as entradas u, e uz, d períodos de amostragem 
antes. É importante notar que, devido ao atraso puro de tempo d, os valores 
fornecidos pelo sistema de visão correspondem à posição ocupada pelo robô 
d períodos de amostragem antes. 

No passo 7, calcula-se a predição de dois passos à frente utilizando-se 
(ver Seção 13.2): a predição de um passo à frente, um valor medido? e as 
entradas efetivamente aplicadas ao robô d — 1 passos antes. 

O algoritmo prossegue (passos 8 a 10) até que o atraso puro de tempo d 
seja compensado. Se d for muito grande, a predição de d passos à frente po- 
dem tornar-se ruins. No passo 11, calcula-se a ação de controle utilizando os 
valores preditos, em vez dos valores medidos disponíveis (que correspondem 
a d intervalos antes). Finalmente, no passo 12 fecha-se a malha e reinicia-se 
o algoritmo no passo 5 com os valores mais recentes fornecidos pelo sistema 
de visão. 

O ganho alcançado ao se usar o modelo (16.47) para compor a malha 
de controle da Figura 16,55 para o controle da posição angular pode ser 
apreciado comparando-se as respostas em malha fechada mostradas na Fi- 
gura 16,57. Finalmente, observa-se que os parâmetros do modelo (16.47) 
foram estimados recursivamente e em tempo real para garantir um controle 
mais rígido, Aos interessados em aplicações em robótica sugere-se a leitura 
de (Campos, 2007). 


3Pois o modelo (16,47) é de segunda ordem, | 
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FIGURA 16.57: Controle da posição angular 


Controle da posição angular para o caso (a) sem preditor e 
(b) com o preditor (16.47), a última equação (PEREIRA, 2000). 


16.13 Movimento Facial Durante a Fala 


Um dos sinais do quotidiano que é mais importante na comunicação entre 
pessoas é o sinal de fala. Entretanto, ao contrário do que possa parecer 
à primeira vista, a informação lingúística não está restrita a esse sinal, 
mas encontra-se espalhado por toda a face, Portanto, a capacidade de 
visualmente extrair tal informação aumenta a percepção da fala como um 
todo. Além disso, tanto o sinal acústico da fala como o movimento facial 
têm sua origem no mesmo sistema neuromuscular (BATESON; YEHIA, 1996). 
Assim sendo, é importante poder modelar a relação dinâmica que existe 
entre o sistema neuromuscular e o movimento facial durante a fala para 
poder implementar um sistema unificado de produção de fala. O presente 
estudo de caso objetiva ilustrar alguns aspectos da modelagem envolvida 
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nesse problema. Uma descrição mais detalhada pode ser encontrada em 
(YARED, 2001; YARED et al., 2002). 


Os sinais de entrada para o presente problema são 8 sinais obtidos por 
meio de eletromiograma correspondente a 8 músculos faciais. O sinais elétri- 
cos captados por 8 eletrodos — e colocados sobre um lado da face — foram 
amostrados a 2.500 Hz e devidamente pré-processados. À saída ideal seria o 
movimento facial, A fim de quantificar tal movimento, 11 marcadores infra- 
vermelhos foram colocados sobre o outro lado da face e observados por meio 
de um sistema de visão, que fornecia as coordenadas cartesianas x, y e z de 
cada um desses marcadores (BATESON; YEHIA, 1996). As posições dos mar- 
cadores sobre a face estão ilustradas na Figura 16.58. Consegiientemente, 
um modelo matemático deveria relacionar oito sinais de eletromiograma 
processado a 33 posições no espaço. Evidentemente, relacionar esse grande 
número de variáveis é, na prática, muito difícil. 


FIGURA 16.58: Posição de marcadores sobrea a face 
Os marcadores são diodos emissores de infravermelho. Um sis- 
tema de visão fornece as coordenadas cartesianas z, y e z para 
cada marcador. Os sinais de entrada são coletados por meio de 
oito eletrodos (não mostrados na figura) instalados do outro lado 
da face (YARED, 2001). 


A pergunta que naturalmente surge é se todos os sinais de saída são 
rigorosamente necessários, tendo em vista que existem restrições físicas na 
face que não permitem que marcadores próximos se movam de forma des- 
correlacionada. Além disso, dependendo da posição do marcador na face, as 
respectivas coordenadas cartesianas z, y e z não terão a mesma relevância. 
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A fim de reduzir a dimensionalidade do problema, foi efetuada uma 
análise por componentes principais (PCA) que no presente caso resulta em 
(AKAY, 1998) 


Yrxn = DoxasX33xNo (16.49) 


em que N é o número de observações, X é a matriz que contém as coor- 
denadas cartesianas x, y e z dos 11 marcadores, Y é a matriz que contém 
as componentes principais e 6 é uma matriz que contém os autovetores da 
matriz de covariância de X. 

Na expressão (16.49) o número 7 foi escolhido de forma heurística. As 
7 primeiras componentes explicam 99,2% da variância das trajetórias. Na 
prática, isso quer dizer que ao invés de tentar explicar 33 coordenadas, o 
modelo terá que explicar apenas 7 componentes principais. Usando-se a 
matriz & é possível mapear essas 7 componentes de volta para o espaço 
cartesiano dos 11 marcadores. Matematicamente, tem-se 


X = DysxrYixn- (16.50) 


Os modelos usados foram lineares do tipo ARX e não-lineares do tipo 
NARX polinomiais e neurais. Para cada componente principal (CP) obteve- 
se um modelo que tinha como entradas os oito sinais do eletromiograma 
processado. Os dados utilizados foram coletados durante o pronunciamento 
de uma determinada frase, conforme ilustrado na Figura 16.59. 

Para cada componente principal seis situações foram estudadas, a sa- 
ber: Teste I) estrutura e parâmetros fixos; Teste 11) estrutura fixa e um 
conjunto diferente de parâmetros para cada segmento da sentença; e Tes- 
te III) estrutura e parâmetros diferentes para cada segmento da sentença. 
Esses três testes foram implementados tanto para os modelos lineares quan- 
to para modelos não-lincares, perfazendo assim as seis situações estudadas. 
Os resultados são resumidos na Tabela 16,3. 

Deve ser notado que houve uma melhora significativa no desempenho 
dos modelos, tanto lineares quanto não-lincares, ao se passar do Teste I 
para o Teste II. Por outro lado, não parece haver diferença significativa 
entre os resultados do Teste I dos modelos lineares quando comparado aos 
resultados correspondentes obtidos usando-se modelos não-lineares. Isso 
sugere que o sistema é mais fortemente variante no tempo do que não- 
linear. Por outro lado, o ganho ao se escolher uma estrutura de modelo 
particular para cada segmento (Teste III) parece ser marginal. Isso sugere 
que um bom compromisso é trabalhar com uma estrutura única para todas 
os segmentos, mas reestimando-se parâmetros para cada segmento. 


“Do inglês principal component analisys. 
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mi 
Milivil IX 


3 
t(s) 
FicuRA 16.59: Sinal acústico de frase repetida três vezes 
Três execuções da frase: “When the (1) / sunlight (II) / stri- 
kes (III) / rain drops (IV) / in the air, (V) / they act (VI) 
/ like a (VII) / prism and (VIII) / form a rainbow (IX)”. Os 
segmentos estão indicados pelas linhas tracejadas. Deve ser no- 


tado que esses dados acústicos não foram usados na modelagem 
(BATESON, YEHIA, 1996). 


TABELA 16.3: Coeficientes de correlação entre dados reais e estimados pa- 
ra modelos lineares (à esquerda) e modelos não-lineares (à direita). Teste 
I) estrutura e parâmetros fixos, Teste II) estrutura fixa e um conjunto dife- 
rente de parâmetros para cada segmento da sentença, e Teste III) estrutura 
e parâmetros diferentes para cada segmento da sentença. 


Teste I | Teste II | Teste II | Teste I | Teste II | Teste III 
DOE | OM | GO | D6M | OO 

0,965 0,761 | 0,989 
0,999 | 0,588 | 0,986 


| ; 0,929 
0,533 0,968 0,998 0,615 0,991 0,999 
0,413 0,986 0,998 0,472 | 0,965 0,998 


970 |[ 0,841 | 0,993 | 0,909 


FONTE: YARED et al., 2002. 


Digitalizado com CamScanner 


16.14 PREVISÃO DE CONSUMO DE ENERGIA 663 


16.14 Previsão de Consumo de Energia 


Em diversos problemas práticos é interessante se ter uma previsão de quanta 
energia elétrica será demandada de um determinado barramento do sistema. 
Assim sendo, o problema de previsão de curto prazo do consumo de energia 
tem sido alvo de diversos estudos. Os resultados mostrados na presente 
seção consideram uma série temporal de potência aparente coletada ao longo 
de nove semanas com período de amostragem de uma hora. À série temporal 
completa está mostrada na Figura 16.60a. 


Pa 


Mo 


kVA 
Bi-$T8 s 


E 


(] 500 1000 1500 


FIGURA 16.60; Séries de potência aparente 


Séries de potência aparente utilizadas. Em (a) tem-se a série 
medida, (b) série composta de dois ciclos médios, um correspon- 
dente a dias úteis e sábados e outro a domingos e feriados. A 
série de resíduos em (c) é a diferença da série medida e a série 
de ciclos médios (RODRIGUES, 2002). 


Em se tratando de um barramento para fornecimento de energia elétrica 
em área residencial, o consumo de energia é fortemente influenciado pela 
hora do dia, como pode ser observado notando-se o evidente ciclo diário pre- 
sente na série mostrada em Figura 16.60a. Deseja-se saber se há dinâmica 
passível de ser predita além do evidente ciclo diário e, em caso afirmativo, 
fazer a predição usando modelos matemáticos. 
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Para responder a essa pergunta decidiu-se subtrair da série original o 
ciclo diário. Utilizando-se uma rede do tipo Kohonen, todos os ciclos da 
série foram classificados. Após extenso estudo, a rede separou todos os 
ciclos em apenas duas classes, a saber: dias úteis e sábados, por um lado; 
domingo e feriados, por outro. 


A série de ciclos bem como a série residual estão mostradas nos gráficos 
da Figuras 16.60b e 16.60c, respectivamente. Portanto, deseja-se saber se 
há alguma dinâmica residual na série mostrada na Figura 16.60c. Em caso 
negativo, isso indica que seria injustificado se buscar um modelo matemático 
mais sofisticado que a média dos ciclos diários em questão, pelo menos para 
efeito de previsão de curto prazo. 


A fim de avaliar o grau de determinismo, ou seja, para verificar se há 
evidências de dinâmica residual na série da Figura 16.60c, seguiu-se um 
procedimento baseado em análise de dados sub-rogados, conforme descrito 
em (GOMES et al., 2000). Um procedimento semelhante, desenvolvido es- 
pecificamente para achar algum vínculo determinístico de curto prazo em 
séries com ciclos, foi apresentado em (COELHO, 2006). 


Inicialmente, a série de nove semanas foi subdividida em nove segmentos 
de uma semana. Dessas nove janelas de dados uma se mostrou fortemente 
não-estacionária e não foi utilizada na análise. Das oito janelas restantes, em 
quatro foi possível rejeitar a hipótese nula de que os dados eram aleatórios. 
Em outras palavras, em quatro janelas havia indícios de alguma dinâmica 
não-linear subjacente aos dados, sendo que nas outras quatro janelas não 
havia tais indícios. 


O resultado mostrado na Figura 16.61 é típico de uma janela em que 
foram achados indícios de dinâmica não-linear na respectiva janela residual 
(ver Figura 16.60c). Nesse caso, é de se esperar que um modelo matemático 
seja capaz de explicar, pelo menos em parte, a dinâmica residual. Em outras 
palavras, deve ser possível fazer uma previsão melhor do que simplesmente 
usar o ciclo médio. O resultado mostrado na Figura 16.62 é o análogo para 
o caso em que não foram achados indícios de dinâmica residual. 


Como esperado, o previsor utilizado na Figura 16,62 não desempenha 
melhor do que o ciclo médio, Essa observação é importante na medida em 
que nem sempre existem estudos sistemáticos para avaliar se é justificável 
utilizar modelos matemáticos sofisticados para se fazer a previsão de uma 
determinada série temporal, 


No presente estudo de caso, os modelos utilizados foram redes neurais 
multicamada (RODRIGUES, 2002), A aplicação do preditor local linear em 
séries de carga foi investigada em (SILVA, 2004). 
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Figura 16.61: Previsão em janela mais determinística 


(—) Trecho de dados medidos, (-*-) ciclo médio e (-—) sinal 
previsto por um modelo não-linear, que está claramente mais 
próximo do sinal medido do que o ciclo médio (LIMA et al., 2002). 


FIGURA 16.62: Previsão em janela menos determinística 


Os padrões usados são iguais aos da Figura 16.61. Note que 
o sinal previsto por modelo não-linear não está mais próximo 
dos dados medidos do que o simples cálculo do ciclo médio. O 
presente resultado corresponde a uma janela em que não havia 
indícios de dinâmica não-linear no sinal. 
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Leitura Recomendada 


O objetivo desta seção é mencionar trabalhos em que podem ser encontra- 
dos detalhes dos sistemas e resultados descritos neste capítulo, Diversas 
dissertações de mestrado e trabalhos estão disponíveis na Internet. º 

O circuito de Chua foi originalmente proposto como um paradigma 
para estudar dinâmica não-linear (CHUA, 1992). Os modelos apresenta- 
dos na Seção 16.2 foram originalmente descritos em (RODRIGUES, 1996) 
e (CORRBA, 1997). Maiores detalhes sobre a análise e identificação desse 
circuito podem ser encontrados em (AGUIRRE et al., 1997; AGUIRRE, 1997; 
ELGAR et al., 1998; FREITAS; AGUIRRE, 1999; AGUIRRE et al., 2000a). 

O pequeno aquecedor elétrico descrito na Seção 16.3 foi originalmente 
estudado por Abreu (1993) sob orientação do professor Fábio Jota. Poste- 
riormente, o mesmo sistema foi identificado usando-se modelos não-lineares 
por alunos do grupo MACSIN (RoDriIGUES, 1996; RODRIGUES et al., 1996; 
Corrêa, 1997). 

O conversor CO-CC buck, estudado na Seção 16.4, foi considerado em 
trabalho anterior (SANTOS-FILHO; AGUIRRE, 1997). Os detalhes da iden- 
tificação desse sistema utilizando conhecimento a priori podem ser encon- 
trados em (AGUIRRE et al., 2000). 

A válvula pneumática usada na Seção 16.5 está instalada numa planta 
piloto originalmente estudada por Braga (1994) sob orientação do profes- 
sor Fábio Jota. A identificação de sistemas não-lineares com característi- 
cas estáticas conhecidas, como é o caso da válvula, foi estudada usando-se 
técnicas não-lineares em diversos trabalhos do grupo MACSIN (JÁCOME, 
1996; AGUIRRE et al., 19982; AGUIRRE et al., 1998b; AGUIRRE; JÁCOME, 
1998; AGUIRRE et al., 2002). Relacionado a isso, o aquecedor com dissipa- 
ção variável foi estudado originalmente em (CAssint, 1999) também com o 
objetivo de estimar a característica estática do sistema recursivamente. 

Os dados biomédicos de parada respiratória vistos na Seção 16.7 fo- 
ram estudados e modelados utilizando-se modelos não-autônomos conforme 
descrito em (BARROS, 1997). O procedimento de análise de estabilidade e 
o seu uso para caracterizar o padrão respiratório do paciente foi primeira- 
mente proposto em (AGUIRRE et al., 1999), sendo que os primeiros estudos 
sobre a sua aplicação na detecção precoce de apnéia foram realizados em 
(Souza, 2001). Posteriormente, modelos autônomos foram obtidos para O 
mesmo conjunto de dados (AGUIRRE; SOUZA, 2004). 

Como mencionado, os dados de fregiência cardíaca descritos na Se- 
ção 16.8 fazem parte de um conjunto de dados mais amplo coletado e 
estudado originalmente por Guimarães (1996). Os mesmos dados foram 


“http://www. cpdee.ufmg.br/"MACSIN, 
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analisados recentemente utilizando-se modelos NARMA na busca de deter- 
minismo (GOMES, 2001; GOMES ct al., 2000). 

A planta de flotação em coluna, mencionada na Seção 16.9, foi 
originalmente instrumentalizada e identificada conforme descrito em 
(SARAIVA, 1998). A série de preços usada na Seção 16.10 vem sendo es- 
tudada com ferramentas de identificação conforme descrito em (AGUIRRE; 
AGUIRRE, 1999; AGUIRRE; AGUIRRE, 2000). 

Os detalhes referentes à estimação de parâmetros de uma máquina de 
indução, descrita na Seção 16.11, podem ser vistos em (OLIVEIRA et al., 
1998) e principalmente em (OLIVEIRA, 1998). Maiores detalhes sobre es- 
timação de parâmetros de máquinas podem ser encontrados em (HoLTZ; 
THIMM, 1991; LIMA et al., 1997). 

O microrrobô, cuja identificação foi descrita na Seção 16.12, fez parte 
de um projeto maior, chamado MIneiROSOT, coordenado pelo professor 
Mário Campos (CAMPOS et al., 1998). 

Os procedimentos seguidos nos estudos de caso descritos nas Seções 16.13 
e 16.14 podem ser encontrados, respectivamente, nas dissertações de mes- 
trado de Glauco Yared (2002) e Daniela Rodrigues (2002). Uma síntese dos 
principais resultados de tais trabalhos podem ser encontrados em (YARED 
et al., 2002) e (LIMA et al. 2001). Em particular, os resultados descri- 
tos na Seção 16.14 foram obtidos usando-se redes neurais multicamadas 
(RopRIGUES, 2002), mas resultados semelhantes foram obtidos com mode- 
los polinomiais (COELHO et al., 2003) e com o preditor local linear (SILVA, 
2003). Maiores detalhes no uso de redes neurais em problemas de previsão 
de carga podem ser encontrados em (ZHANG et al., 1998; ALVES DA SILVA; 
MovuLin, 2000; HIPPERT et al, 2001). 


Exercícios 


16,1. A partir da Tabela 16,1 e dos resultados das Seções 10.5 e 10.6, 
tente explicar por que o modelo (16,4) tem pontos fixos complexos. Além 
disso, proponha alterações na estrutura do modelo no sentido de contornar 
o problema, 


16,2, Use os dados acg7000 O, mostrados na Figura 1.13 e o procedimento 
descrito na Seção 12.2.3 para decidir qual taxa de decimação utilizar nesse 
caso, Compare o seu resultado com o descrito no final da Seção 16.4.2, 


16.3. Discuta as razões pelas quais modelos lineares não são adequados 
para representar características estáticas como, por exemplo, a mostrada na 
Eq. 16.18. Determine a relação estática 7(h)/7(k) para o modelo (16.15). 
Compare o resultado com (16.18). 
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16.4, Determine a característica estática do modelo (16.16) e compare-a 
com a característica estática teórica expressa pela Eq. 16.18. 
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Anexo À 


Alguns Resultados Sobre 
Vetores e Matrizes 


A1 Definições Básicas 


Definição A.1.1. A matriz À E IRº*” é definida positiva se x” Ax > 0, 
vx*0,x€E R”. 

Definição A.1.2. A matriz A€IR"*” é semidefinida positiva se x" Ax>0, 
vx 0, xe. 

Definição A.1.3. Dois vetores x€IR” e y IR” são ortogonais se x"y =0. 
No caso estocástico, a condição de ortogonalidade é Efx"y]=0. 


Definição A.1.4. O produto interno de dois vetores x € IR" e y E IR” é 
(7) = xTy. Portanto, o produto interno de vetores ortogonais é zero. 


Definição A.1.5. O produto externo de dois vetores x E IR” ey E IR" é 
xy” e RT", 

Definição A.1.6. Uma matriz 4 € IRºX" tal que ATA = 1, em que 1 é à 
matriz identidade de ordem n, é dita ortogonal, 


Definição A.1.7. A norma euclideana de uma matriz A € IRPX" é 


[4x | 

, 
[ES] 
sendo que x O e supl:] indica o supremo, definido como o menor limite 
superior. Esta norma, também conhecida como a norma 2 de 4, iguala o 
maior valor singular de 4, 


LA = sup 


(A.1) 
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Definição A.1.8. A norma de Fyobenius de uma matriz A E IR" é 


pAle= (DS virar A), (A.2) 
i=lj= 


sendo que tr[-] indica o traço. 


A.2 Algumas Propriedades 


Propriedade A.2.1. Sejam as matrizes quadradas e não-singulares A, B, 
então (AB)! = B-1AM. 

Propriedade A.2.2. Se À é uma matriz real, então AA” é semidefinida 
positiva. 

Propriedade A.2.3. Se À é uma matriz quadrada e não-singular, então 
AT é não-singular e [AT]! = [A-I]T. 


A.3 Algumas Operações 


Seja a matriz A € IR"X” e os vetores x E IR” e y € IR”. As seguintes 
relações são verdadeiras: 


ue => (A3) 
ne mix; (A.4) 

POA (A 4 AM (A) 
nao =A(B+B). (A.6) 
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A.4 Lemas 


O lema a seguir é chamado de Lema da inversão de matrizes e é muito útil 
no desenvolvimento de diversos algoritmos de identificação. 


Lema A.4.1. Supondo que as inversas existam, 
[A + BOD]"! = A-! — AclB(c-! + DA! BJ! DAS. (AM) 


Prova. Para que a igualdade acima seja verdadeira, o produto das duas 
partes de cada lado da igualdade deve ser a matriz identidade. Logo, 


[4+BCDJ! = (A! -AB(C + DA!B! DAM) 

1 + BCDA! — [B + BCDA-!BJ[C"! + DA! BJ-!DA 

1 + BCDA! — BO[C-! + DA-!B][C"! + DA-! BJ! DA” 
k 


Lema A.4.2. Supondo que as inversas existam, 


[A+ Bj! = BA! + Bola = AMA! + Boyle. (AB) 
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Anexo B 


Decomposição de Matrizes 


B.1 Motivação 


Como visto nos Capítulos 4 e 5, o problema de estimação de parâmetros de 
modelos do tipo y(k) = "8 +e(k) usando o método de mínimos quadrados 
se resume à solução da seguinte equação: 


ômq = [9TWj Ty. (B.1) 


Na equação acima, a matriz WWW € IR"*" é chamada de matriz normal 
ou matriz de informação. Essa matriz tem as seguintes características por 
construção: i) é uma matriz simétrica, e ii) é definida positiva. Matrizes com 
estas características são passíveis de serem invertidas utilizando-se técnicas 
específicas. Neste apêndice, serão brevemente descritas três formas de fato- 
rar matrizes com as características acima mencionadas. O objetivo final é 
poder calcular a inversa [W"W]-! de forma mais fácil e precisa, evitando mal- 
condicionamento numérico, Detalhes sobre as técnicas descritas podem ser 
encontrados em diversos livros especializados (GOLUB; VAN-LOAN, 1989). 


B.2  Fatoração de Choleski e Fatoração LU 


A seguir será usada a seguinte notação A = W'W, Portanto, como À é 
simétrica e definida positiva (por construção) e A € IR"*", então 


A=LI”, (B.2) 


sendo que L E IR"*” é triangular inferior e os elementos da diagonal prin- 
cipal são todos positivos. Por causa de (B.2), a inversão de A torna-se mais 
facil, pois A! = [LL"]-! = L-"L-! e como L é triangular, tal matriz pode 
ser invertida uma linha por vez. 
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A questão agora é como obter L. Para ver isso, (B.2) pode ser reescrita 
da seguinte forma: 


tu ta co Lu 
dad 

[Ai da... An) = [Dr Baco. ba) o cabo (B.3) 
lan 


sendo que A; e L; são as i-ésimas colunas de A e L, respectivamente, e li; 
é o elemento de L localizado na i-ésima linha e j-ésima coluna. 
Da equação acima, vê-se claramente que 4; = Lit1, ou seja: 


an tu 
az ta 

. |= tu, (B.4) 
n1 tm 


sendo que os a's são os elementos da matriz 4. Como pode ser visto, 
Ly = A1/tn, e da última equação torna-se claro que aj = 424, portanto, 
tn = am e, assim, obtém-se Lj. Semelhantemente, da Eq.B.3 tem- 
se Ay = Lifa, + Lotoo. Nessa expressão, o único elemento desconhecido é 
Loto», pois £3, é o segundo elemento de Li, que já foi determinado. Obser- 
vando que az, = (3, +(3,, tem-se £32 = [a22 — 43]. Finalmente, a segunda 
coluna da matriz L é 


— A2— Intm 


too (rm 


L2 


Procedendo-se dessa forma, determinam-se todas as colunas da matriz L. 

O fato de a matriz A ser positiva definida garante que os radicandos são 
sempre positivos. As raízes quadradas podem ser evitadas decompondo-se 
a matriz A da seguinte forma: 


A=LDIT, (B.6) 


sendo D € IR"X" e D=diag[d, do ... dn). Neste caso, L continua sendo uma 
matriz triangular inferior, mas agora os elementos na diagonal principal são 
todos iguais a 1. 

Uma fatoração bastante usada e similar à de Choleski é a chamada fato- 
ração LU. Neste caso, tem-se 4 = LU, em que L é uma matriz triangular 
inferior com 1's na diagonal principal e U é uma matriz triangular superior. 
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B.3 A transformação de Houscholder 


O desenvolvimento da Seção 11.29 pressupôs a existência da matriz QQ tal 


ovo 


Quik) = QuTô+QE(K) 
v(k) = UTôre(h). 


Uma forma de obter Q de forma a satisfazer 
gro=1equ= [4] 


= usando a transformação de Householder. Para isso, será definida a seguinte 
saatriz estendida Y = [V y] € R” *(n+1), O procedimento consiste em achar 
=: matrizes de Householder, H(), de forma a se obter a matriz 


Q = HM. HO, (B7) 


e QU = Yl"), de forma a se ter 


- V . 
sm = | ap | (8.8) 


sendo que os vetores yj, y3 e a matriz V foram definidos previamente e se 
relacionam conforme mostrado em (11,15), O que falta definir agora é como 
oster as matrizes de transformação de Householder, H(Í, que aparecem em 
(6.7). Uma matriz de transformação de Householder é definida da seguinte 


forma: 


HO =]- pt vii ylidr, = ham (8.9) 


sendo que vem" e 


Digitalizado com CamScanner 


676 B DecoMPoOSIÇÃO DE MATRIZES 


0, j<1; 
vb = 4 UfD sn [949] old j=i; (B.10) 
E j>to 


sendo que VD &o (ji)-tsimo elemento da matriz estendida W(=D e sgnf] 
retorna o sinal algébrico do argumento. Além disso, os escalares p(D e a(i) 
são definidos como 


; 1 
(ss (Bi 
E qo0+ ND 


N 
= [fr (812) 
j=i 


O ponto de partida do algoritmo é Y() = W, sendo que passos sub- 
seguentes envolvem o cálculo de 


TO = HOGU-D j=1,...,n. 


Na prática, uma forma mais eficiente de calcular Tl) é 


50 = (vp 
BED - VOO OPEE-D, =... (B13) 


Portanto, usando (B.13) e as Definições B.10 a B.12, começando com 


Y(0) = 4, chega-se a W(?) que, segundo (B.8), contém a matriz V e o vetor 
y1, necessários à determinação de ômq, como pode ser visto em (11.16). | 


B.4 Decomposição em Valores Singulares 
Neste método, uma matriz Y E IRN*" é decomposta da seguinte forma: 


W=UBV", (B.14) 


sendo U E IRNXN, E E IRNX" e V E IR"X", Além disso, U e V são matrizes 
ortogonais, e Z é uma matriz cujos únicos elementos diferentes de zero são 
Oii) 1<i<mn. Esses elementos são 


oi = veig[UTW), (B.15) 


| 
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Sendo que eig[) indica os autovalores, Usando (B.14), tem-se 


VTYVy 


(UZVTYT(UZVT)V 

= (BVTJUTUEVTV 

= VEIUTULVTV 

= VE'S, (B.16) 


Sendo que no último passo foi usada a propriedade de ortogonalidade das 
matrizes U e V, ou seja, UTU = Iy e VTV = Ip. Note-se que B”D € IR"*" 


& wma matriz diagonal com elementos oi. Portanto, 


ot 
2 
T om 
UTUvi va... Va] = [vi v2.«Vn] (B.17) 
on 
“A última equação matricial pode ser reescrita como se segue: 
7 RR 
Viv, = cyvi 
VTYy, = obva 
WUvi = oúvi (B.18) 


Comparando a última equação com à conhecida expressão Av = Av 
e lembrado que o3; são os autovalores de YTW (ver Eq. B.15), tem-se que 
vi; é 0 i-ésimo autovetor correspondente a oz. Portanto, se oi = 0, para 
qualquer à, então há dependência linear entre as colunas de YTW. 


B.4.1 Aplicação à estimação de parâmetros 


Seja a equação matricial y = VÔ +€. Pré-multiplicando essa equação por 
UT e decompondo a matriz de regressores conforme indicado na Eq.B.14, 


tem-se 
U'y = UTyÔ+UTE 
= UTULVTÔ+UTE 
= DVTÔ+UTE 
y' = 08 +, (B.19) 
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sendo y* = UTy, 0º = VTô e &* = UTE. Como UT” é ortogonal, então 
Jvs = Juq. Isso pode ser visto escrevendo-se 


dos = (y'-20)(y' — 20º) . 
(UTy —- UTUSVTÔ)T(UTy — UTULVTÔ) 


(y — Vô)TUUT(y — VÔ) = Jo, (B.20) 


NH 


] 


sendo que para chegar à última igualdade foi usado o fato de UT ser orto- 
gonal. Levando em consideração a estrutura da matriz E, tem-se 


ouôi 

X 02205 
Dô' = ai (B.21) 

OnnÔ!, 


0 


sendo que o vetor nulo O tem dimensão (N — n) x 1. A função custo neste 


caso é 
ds B bi o 
(o) 
= y'Ty' -yi"miô' ÃA “oTy + 0 nrod" 
(vi — Bô)"(yt — 219) + y3" y3, (B.22) 


l 


Jys 


sendo y* = [yi” y5"]", yi (E ado eyje IRN-"X1, Claramente, Jys será 
minimizado quando yj = 210, ou seja, quando 


vi oudi 
vi: o 0: 

Ei a aa E (B.23) 
Vin Onnbk 


Como os valores envolvidos em cada linha são escalares, tem-se que os 
elementos do vetor de parâmetros a ser determinados um de cada 
vez, ou seja, 0; = y;/Oiiy i=1,. 
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Anexo C 


Conceitos de Estatística 


C.1 Definições Básicas 


Definição C.1.1. Seja z uma variável aleatória e Z seu valor estimado. A 
polarização (tendência ou viés) é definida como 


b=Eli]-z. (C.1) 
Definição C.1.2. A variância de x é definida como 
var(2] = o2 = E [(z — Efz])?). (C.2) 


Definição C.1.3. Para um vetor x € IR”, a matriz de covariância tem 
dimensão n x n e é definida como 


covfx] = Bl(x — Elx))(x — Efx))"] = Bo] - EJB") (C3) 


Definição C.1.4. O valor quadrático médio de um escalar z é 
vqm([z] = Elz?]. (C.4) 
Definição C.1.5. A matriz de valor quadrático médio de um vetor x é 
mms[x] = E [xx”], (C.5) 
sendo que “mms” vem do termo em inglês matriz mean square. 
Definição C.1.6. A função de autocorrelação de x(t) é 


Tra(Tit) = Efz(t)z*(t + m)). 


Se z(t) for real z*(t+ 7) = z(t+ 7). 
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Definição C.1.7. A função de autocovariância de z(t) é 


Cre(Tit) = rez(Tit) — Ele(t) Elo" (8), 


sendo que E[x(t)]E(z*(t)] = |Elz(t)]]?. 
Definição C.1.8. A função de correlação cruzada x(t) e y(t) é 


ray(rt) = Ele(B)y'(t + 7). 


Definição C.1.9. A função de covariância cruzada de x(t) e y(t) é 


cay(rit) = Pay(mot) — Ele(t)E(y" (é + 7). 


Definição C.1.10. Dois processos z(t) e y(t) são ortogonais se 


ray(Tt) = Ele(t)y"(t + T]=0, Vtr. 


Definição C.1.11. Dois processos z(t) e y(t) são não-correlacionados se 


CoylTit) =0, Vtyr. 


Definição C.1.12. Um processo estocástico é estacionário no sentido 
estrito se sua densidade de probabilidade se mantém inalterada após a 
mudança da origem no tempo. 


Definição C.1.13. Um processo estocástico é estacionário no sentido 
amplo (ou estacionariedade fraca) se sua média é constante (ver Propri- 
edade C,2.9). 


C.2 Algumas Propriedades 


Propriedade C.2.1, A esperança matemática de uma variável determi- 
nística é igual à própria variável. 


| 
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Propriedade C.2.2. À esperança matemática de uma soma é a soma da | 
esperança matemática de suas partes, sejam ou não estatisticamente inde- 
pendentes. Ou seja, 


E [> | => Ele (C.8) 


Propriedade C.2.3. A esperança matemática do produto de variáveis alea- 
tórias é igual ao produto das esperanças individuais se tais variáveis forem 
estatisticamente independentes. Ou seja, 


E o a] = H Elzi), (C.7) 


se e somente se x; for independente de z;, Vi £ j. 
Propriedade C.2.4. Seja a variável aleatória 2 e a constante a, então 
var[a 2) = a? var[2). (C.8) 


Propriedade C.2.5. Sejam x, e z2 variáveis aleatórias independentes, 
então tem-se 


var(z1 + 22) = var[21) + var[29). (0.9) 


Propriedade C.2.6. Por construção, a matriz de covariância cov[x] é si- 
métrica e semidefinida positiva. 


Propriedade C.2.7, Para variáveis com média nula, a matriz de covari- 
ância é igual à matriz de valor quadrático médio. 


Propriedade C,2,8. A matriz de covariância do vetor Cx é 
cov[Cx] = Ccov[x]C”, (C.10) 


Propriedade C.2.9. Se um processo for estacionário no sentido amplo, 
então sua função de correlação somente dependerá da diferença temporal 
considerada |ti — ta|= 7. Portanto, 


Tuyltuto) = Elu(ti)y(ta)] = Elu(t)y(t + 7)] = ruy(r). 


Propriedade C.2.10. Se um processo for estacionário, então sua função 
de autocorrelação será simétrica, ou seja, rzz(7) = rzz(—7). 
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C.3 Propriedades Assintóticas de Estimadores 


Propriedades assintóticas são propriedades estatísticas que variam à medida 
que o número de observações tende a infinito, N — 00. As propriedades 
estatísticas que não dependem, em princípio, de N são chamadas de pro- 
priedades para pequenas amostras (PPA).! 

Se um determinado estimador tiver uma certa propriedade para peque- 
nas amostras, então tal estimador também terá a respectiva propriedade 
assintótica. O contrário não é necessariamente verdadeiro. Nesse sentido, 
as propriedades assintóticas são mais “relaxadas” do que as PPA, 


Definição C.3.1. Se a distribuição de probabilidade de um determinado 
estimador variar à medida que N — oo, então a distribuição para a qual 
ela tende será a distribuição assintótica. 


Definição C.3.2. A média assintótica de Ô(N) é definida como 


ôn(N) = lim E(Ô(N)). (0.11) 
Definição C.3.3. A variância assintótica de Ô(N) é definida como 
03. = + im e[n (oem - dum) dl (0.12) 
N500 
Definição C.3.4. A polarização assintótica de 9(N) é definida como 
ba= nim EJô(N)] -0. (C.13) 


Definição C.3.5. Limite de probabilidade. ô(N) é dito convergir em pro- 
babilidade para 0, plim[9(N)] = 0, se 
Prob [jô(N) - 6|< d >1-m YN>N (G.14) 
e sendo 0 < (em) < 1. Uma outra forma de expressar (C.14) é 
Nim Prob [18(n) -a|> 50. (615) 
Algumas propriedades do limite de probabilidade são enunciadas a seguir. 
Propriedade C.3.1. 
plim[f(ô)] = f(plim[ô]). (C.16) 
Por exemplo plim[(8)2] = (plim[8])2. 


*Em inglês o termo é: small sample properties. 
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Propriedade C.3.2. Sejam A e B duas matrizes de dimensões compatíveis 
e funções das mesmas variáveis aleatórias. Então, 


plim[AB) = plim[AJplim[B). (C.17) 
Propriedade C.3.3. 
plim [ve] =c, (C.18) 


sendo que c é um vetor. Se e for estacionário, então c é o vetor que contém 
os índices de correlação entre e e as colunas de Y. 
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Anexo D 


Tabelas de Transformadas de 


Laplace 


TABELA D.1: Pares de transformadas de Laplace (continua) 


O) 
Impulso unitário, ó(t) 
a Mt)=0,VE<O 
Degrau unitário, H)=1,W>0 


eat 

ter at 

sen wt 

cos ul 

EP, nslQpii 
Werol, n=],2,. 
paleta) 
tis(be-t ae at) 
ate eia) 
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TABELA D.l: Pares de transformadas de Laplace (conclusão) 


e“'senwt 


e-“coswt 


2 


E TDR À 
E FaQuns tua 


vRqe ten (wn 1-0 t— 6) E 
ra ST FMQuns Fu 
&=tan-l 
1- Veg “een (wn vV1-G2 t+) aê 
dr ae 1-0 57 FMunstwz) 


TABELA D.2: Propriedades da transformada de Laplace 
LAS) =AF(s) 
L (lt) + fale) = Fi(s) + Fo(s) 
La (GB) = sF(s) — f(04) 


fa (fa HO) = (0) - a1(08) — á (0a) 


La (de MO) = 8"P(9) - Dia ot fr (08) 
Le (S s(de) = EO p Latinos 
Le f(t))=F(s+a) 
LlU(t-au(t-a)) =e-º*F(s) 

Lt r(o) = SE 
L(tr(o)) = Jó F(s)ds 
L(($)) = a F(as) 


Na Tabela D.2, uy(t— a) é um degrau unitário começando no instante t = a. 
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de Akaike, 467, 474 - 


dados, 235, 688 
dados biomédicos, 621 
dados de economia, 489, 504, 643 
dados de forno, 485, 487 
dados e rotinas O 
abaco, 107, 108, 116-119 
acq7000, 82, 607, 667 


bfg3, 153 

bfg44, 154 
bias31, 284, 287, 290 
bias61, 260 
catraso, 111, 120 
din3, 614 

din3, 615, 616 
din4, 618 

devci, 433, 588 
ens. 25, 177 
ens. 25, 78, 79 
ens..26, 77, 80 


ensaio6my, 180, 246 
ermgfe, 332, 333 
estat3, 563, 617 
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ex22, 103, 105, 14 
ex322, 145 
ex351, 103, 167 
ex421, 194, 207, 208 
ex522, 239 
exlog, 433, 450, 451 
extended, 435, 451 
exvi, 304-307 
fO307, 4185-488, 600, 602 
f0407, 485, 600 
fO707, 331 
emqmark, 294, 298, 299 
lspademk, 530 
mdi, 517 
mf643, 159 
mf644, 176, 179 
modelo1 , 87 
maq. pos, 227, 235 
mqstate, 337, 340 
myccf, 216, 217 
mydin2, 406 
mymarkov, 527 
mypade, 527 
pmcont, 591 
prbs1o0, 451, 654 
prbsa02, 218, 246, 314, 481, 482, 
583 
prbs, 201, 216 
pulsoio, 168 
pulso30, 178 
pulso, 169, 214 
rtdn, 175 
rtdp, 175 
sdpi30.6, 462 
sim modelo1, 87 
spivcl, 402 
spvci, 589 
tls, 309 
valvula, 611 
decimação, 464, 605, 667 
decisor, 444 
decomposição 
LU, 673 
de Choleski, 293, 673 
em frações parciais, 97, 105, 112 
em valores singulares, 676 
modal, 97 
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deconvolução, 161 
degrau, 104, 688 
densidade espectral de potência 
ver estimação de, 310 
detecção de não-lincaridades, 479 
determinação de estrutura, 45, 81, 383, 
387, 406, 420, 427, 432, 439, 
474, 480, 643, 688 
de modelo ARMAX, 466 
de modelo polinomial NARX, 417 
de modelos polinomiais contínuos, 
414 
de RBFs, 481 
de representações não-lincares, 378, 
474 
de RNAs, 378, 481 
usando agrupamentos, 476 
diagrama 
de bifurcação, 459 
de Bode, 114 
de Nichols, 114 
de Nyquist, 114 
diagrama de bifurcação, 510 
dimensão de imersão, 375 
dinâmica do sistema, 54 
dinâmica não-linear, 512 
distribuição 
a posteriori, 355, 357 
a priori, 355 
gaussiana, 344 
normal, 344 
dominância modal, 114, 515 
índices de, 516, 544 
Duffing-Ueda, 476 
diagrama de bifurcação, 459 
oscilador de, 458, 494, 499, 510, 
572 


eficiência 
de estimador, 268 
de estimador MQ, 273 
equação 
de Riccati discreta, 358 
de Wiener-Hopf, 191, 205, 222, 
228, 229 
logística, 395, 416, 432, 450 
logística fmpar, 395, 416 
normal, 223 


Digitalizado com CamScanner 


Índice Remissivo 


ergodicidade, 183 
ERR 
ver taxa de redução de erro, 426 
erro de predição, 320 
erro de regressão, 224 
erros nas variáveis, 263, 264, 292 
escolha de entradas, 455 
escolha de estrutura 
ver determinação de estrutura, 
45 
espaço de coordenadas de atraso, 392 
espaço de estados, 64, 65, 121, 517 
espaço de imersão, 510 
estacionariedade, 55, 136, 622, 624, 
688 
fraca, 680 
sentido amplo, 680 
sentido estrito, 680 
estimação 
da resposta ao impulso, 193 
da resposta em fregiiência, 166, 
167, 170 
de constante de tempo, 143 
de densidade espectral de potên- 
cia , 310 
de derivadas, 375, 397, 416 
de fregiiência natural, 145 
de ganho, 143 
de matrizes de estado, 334 
de pesos de RNAs, 378 
de pontos fixos, 398, 416 
de quociente de amortecimento, 
144, 158 
de resposta ao impulso, 161, 162 
de resposta em fregiência, 206 
de saída em estado estacionário, 
158 
de tempo morto, 189 
em batelada, 68, 318, 610 
empírica de FT, 170, 214, 215 
recursiva, 68, 318, 610, 617 
estimação de parâmetros, 67, 81, 90, 
420, 427 
de modelos contínuos, 241 
estimador 
bi-objetivo, 444 
BLUE, 312 


mm 


de mínimos quadrados, 219, 226, 
689 
de mínimos quadrados com res- 
trições, 243, 276, 441, 450, 
556, 577 
de mínimos quadrados multiva- 
riável, 242 
de mínimos quadrados pondera- 
dos, 233, 241 
de mínimos quadrados totais, 307, 
312 
de Markov, 293 
de variáveis instrumentais, 300 
estendido de mínimos quadrados, 
285, 286 
generalizado de mínimos quadra- 
dos, 292, 293, 295 
multiobjetivo, 441 
não polarizado, 263 
recursivo de aproximação esto- 
cástica, 327 
recursivo EMQ, 326, 652 
recursivo MQ, 323, 325 
recursivo MQ com À, 330 
recursivo VI, 326 
estrutura de modelo, 688 
Euler 
aproximação explícita, 83, 133 
aproximação implícita, 83, 133 
excitação persistente, 206, 209 


falseamento, 463 
fase, 116, 119 
fast orthogonal search method, 480 
fator de esquecimento, 329 
filtro de Kalman, 336, 337, 341 
filtro de Kalman estendido, 342, 359, 
369 
filtro de Kalman unscented, 342, 369 
filtro descorrelacionador, 293, 296 
fração continuada, 540 
frequência de corte ou canto 
sistema de primeira ordem, 116, 
un 
sistema de segunda ordem, 119 
fregiiência de Nyquist, 463 
função 
coeficiente de correlação, 186 
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de ativação, 377 
escolha, 572, 581 
de autocorrelação, 185, 911, 079, 
6ss 
de processo MA, 186 
de uma senóide, 187 
de autocovariância, 185, 680 
de autovalores, 408, 409, 619 
de correlação cruzada, 184, 455, 
680, 688 
de covariância, 185 
de covariância cruzada, 680 
de densidade de probabilidade 
a posteriori, 347 
a prioni, 347 
condicional, 60, 343 
de erro, 473 
de pertinência, 378 
função de transferência, 62, 94, 103, 
121, 688 
assintoticamente estável, 96 
de fase mínima, 96 
de fase não mínima, 96 
de ruído, 125 
do processo, 125 
em malha fechada, 156 
estável, 96 
estritamente própria, 96 
instável, 96 
própria, 96 
funções de densidade espectral de po- 
tência , 205 
funções de pertinência, 379 
funções radiais de base, 375, 376, 415, 
574 
fusão de fontes de informação, 349 


ganho, 106, 115 

ganho de Kalman, 330 
gaussiano, 344 
generalização, 484 

geração de harmônicas, 461 
Granger, causalidade de, 455 


identificação, 36, 51, 80, 689 
caixa branca, 545 
caixa cinza, 36, 46, 48, 481, 608, 
617, 652 
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caixa preta, 36, 49, 61, 69, 545, 
005 
determinística, 57, 141 
em malha fechada, 159 
estocástica, 57 
não-paramétrica, 141, 181 
no domínio da freqiiência, 164 
usando convolução, 160 
usando funções de correlação, 215 
impulso, 104 
informação 
a priori, 569 
auxiliar, 569, 617 
informação 
a priori, 546 
auxiliar, 36, 546 
inicialização de modelos, 491 
inovação, 320, 325 
instrumentos, 301 
integração em modelos discretos, 402 
intervalo de integração, 83 
intervalos de confiança, 195, 197, 198 
invariância temporal, 54, 485 
inversão de matrizes 
lema, 671 


Jordan 
forma canônica, 97, 123 


Kalman 

ganho de, 330 

ver filtro de Kalman, 336 
Kalman (ver filtro de), 341 
Kalman (ver preditor), 358 
Kautz 

funções de, 372 


lógica fuzzy, 415 
Laguerre 

funções de, 372 
lema 

inversão de matrizes, 671 
Levi 

método de, 211 
linearidade, 53, 113 

nos parâmetros, 68, 81, 222 
Lorenz 

atrator de, 578 
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sistema de, 578 estocástico, 60, 66, 690 
FIR, 126, 283 

média móvel, 129 HR, 126 

métodos determinísticos, 141, 689 matemático, 52 
métodos não-paramétricos, 181, 689 MIMO, 59, 134 


métodos paramétricos, 689 exemplo de, 639 


de covariância, 191, 229, 265, 320, 
467, 482 

de Fisher, 269 

de informação, 673 

de projeção, 232 

de regressores, 236, 252, 463 

de transferência, 122 

de valor quadrático médio, 265 

definida positiva, 669 

jacobiana, 392 

normal, 673 

ortogonal, 669 

ortonormal, 424 

pseudo-inversa, 224 

semidefinida positiva, 669 


modelagem 


baseada em leis físicas, 94 
matemática, 35, 51 
semifísica probabilística, 581 


modelo, 689 


a parâmetros concentrados, 56 
AR, 65, 128 

ARARMAX, 300 

ARIMA, 135 

ARMA, 130 

ARMAX, 66, 129 

ARX, 65, 85, 127, 133, 236 
autônomo, 58, 589, 629 
bilinear, 374 

Box-Jenkins, 132 

contínuo, 57, 133, 137 

de erro na equação, 127, 129 
de erro na saída, 131, 132 

de Hammerstein, 373, 413, 621 
de referência, 531 

de Volterrra, 372, 413 

de Wiener, 373, 413, 621 
determinístico, 59, 690 
dinâmico, 56 

discreto, 57, 85, 124, 133, 137 
estático, 56 


matriz MISO, 59, 238, 491 


exemplo de, 623, 624 

monovariável, 59 

multivariável, 59, 121, 122, 133, 
238, 395 

multivariável e autônomo 

exemplo de, 629 

não autônomo, 58, 589 

não-linear, 371 

não-paramétrico, 61 

NARMAX, 374 

NARX, 374 

paramétrico, 61 

polinomial contínuo, 375, 414 

polinomial NARMAX, 374, 381, 
414 

polinomial NARMAX MIMO, 395 

Pseudolinear, 289 

racional NARMAX, 374, 383, 414, 
436 

SIMO, 59 

sintonia de, 77 

SISO, 59 

VARX, 134, 396 


modelo reduzido, 104 
modelo, exemplo de 


câmara de vácuo-térmico, 41 

conversor estático, 66, 605 

malha de combustíveis, 102 

modelagem baseada em leis físi- 
cas, 70 

Planta de bombeamento, 70, 77, 
169 

população de Folsomia candida, 
87 

sistema biológico, 57 

sistema fisiológico, 128 


modelos relacionais, 415 
modos de uma FT, 97, 104 


dominantes, 100 
não dominantes, 100 
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momentos generalizados, 344 
multiobjetivo 

estimador, 441 
multiplicidade de pólos e zeros, 95 


neurônio neo-fuzzy, 378 
norma 
2,669 
de Cramér-Rao, 268 
euclideana, 669 
Frobenius, 670 


operador de 

atraso, 125, 140 

primeira diferença, 135, 140 
ordem de uma FT, 96 
ortogonalidade, 680, 690 

do estimador MQ, 230, 254 


pólos de uma FT, 95, 96, 103, 109, 
122 
Padé 
aproximação de, 110 
parâmetros, 690 
parâmetros de Markov, 527 
PCA, 455, 478 
período de amostragem, 457 
periodograma, 205 
persistência de excitação, 161, 206, 
209 
plano de fase, 588, 591, 626 
polarização, 250, 254, 266, 284, 679 
assintótica, 300 
em modelos ARX, 259 
em modelos racionais NARMAX, 
384, 417 
polinômio mônico, 107 
pontos de equilíbrio (ver pontos fi- 
xos), 389 
pontos fixos, 389 
de um oscilador, 400 
estabilidade de, 392 
estimação de, 398 
localização de, 390 
número de, 390 
simetria de, 393, 394 
pontos sigma, 363 
PRBS, 200, 457, 690 
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ver sinais pseudo-aleatórios, 199 
predição 
de k passos à frente, 489, 690 
de infinitos passos à frente, 488 
de um passo à frente, 502, 690 
livre, 690 
trivial, 491 
preditor 
de um passo à frente, 486, 488 
preditor de Kalman, 358 
preditora-corretora (estrutura), 357 
princípio da superposição, 53, 120, 
479, 608, 690 
processo estocástico, 690 
produto externo, 669 
produto interno, 426, 669 
pulso, 167, 691 


quociente de amortecimento, 107, 119 


rampa, 104 
reconstrução do espaço de estados, 509 
redes neurais artificiais, 376, 377, 415, 
416, 561 
regra de Bayes, 270 
regressão linear, 237 
regressores, 221 
de modelos não-lineares NARX, 
382 
dinâmicos, 220 
espúrios, 432, 433 
estáticos, 220 
exponenciais, 435 
matriz de, 231, 415 
vetor de, 231, 236 
regularização, 444 
representação matemática, 81, 93 
resíduos, 224 
resíduo no pólo, 96, 112 
resíduos, 487, 501, 691 
análise de, 302, 500, 503 
resíduo no pólo, 112 
resposta ao degrau 
sistema de primeira ordem, 106 
sistema de segunda ordem, 108 
resposta ao impulso, 103, 126, 181 
aproximada, 168 
finita, 126 
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infinita, 126 
polarização, 162 
sistema de primeira ordem, 106 
sistema de segunda ordem, 108 
resposta em freqiiência, 63, 112-114, 
181, 691 
de um derivador, 115 
de um ganho, 115 
de um integrador, 115 
fase, 115 
ganho, 115 
resposta temporal, 104 
Riccati 
equação discreta de, 358 
RMSE, 490 
robótica, 658 
ruído 
de medição, 224 
ruído, 691 
aditivo, 249, 341, 350 
branco, 182, 501, 691 
colorido, 692 
de medição, 341 
de medição, 249, 350 
de processo, 341 
dinâmico, 249, 350 
dinâmico, 341, 349 
linearmente branco, 502 
multiplicativo, 341, 349 
ruído branco, 193 
ruído de atuador, 264 
Runge-Kutta 
algoritmo de, 84 


série de Volterra, 372, 413 
série temporal 

de preços, 489, 504, 643 
sensibilidade às condições iniciais, 509 
sigmóide, 377 
simulação de modelos, 83, 491 
simulação livre, 488 
simulação Monte Carlo, 198 
sinais 

abertos, 165 

aleatórios, 193, 502, 600, 692 

aleatórios, 195 

de seqiiência m, 200, 689 

de teste, 458, 478 
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estacionários, 222 
persistentemente excitantes, 207 
pseudo-aleatórios, 193, 195, 198, 
203, 456, 478, 692 
sincronização 
custo de, 497 
dissipativa, 495 
erro de um passo à frente, 496 
Sinha, N.K., 522 
sistema, 692 
a parâmetros concentrados, 692 
a parâmetros distribuídos, 56, 693 
autônomo, 693 
contínuo, 693 
criticamente amortecido, 108 
de primeira ordem, 106, 142 
de segunda ordem, 107, 143 
dinâmico, 693 
discreto, 693 
estático, 53, 693 
invariante, 55, 222 
linear, 113, 694 
monovariável, 694 
multivariável, 122 
não autônomo, 694 
não-linear, 371, 694 
sobreamortecido, 108 
subamortecido, 108 
sobre-sinal, 109 
sobreamostragem, 463 
sobreparametrização, 43 
somatório de convolução, 126, 160, 
190, 205, 228 
somatório corrido, 136 
Sundaresan 
método de, 145, 151 
SVD, 455, 478 


taxa de decimação, 464, 605, 667 
taxa de redução de erro, 426, 450, 
474, 480, 574, 580 

tempo de acomodação, 109 
tempo de amostragem, 457, 463, 474, 
479, 604 
critério para escolha, 464 
tempo de subida, 109 
tendência (ver polarização), 250, 679 
teorema de Shannon, 463 
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teste, 81, 484, 694 

dinâmico, 159, 478, 600, 604, 638 

em estado estacionário, 76, 613 
teste do determinante, 473 
transformação unscented, 362 
transformada 

2,63 

de Fourier, 63, 164 

de Laplace, 62, 104, 106 

discreta de Fourier, 166, 170 
Tustin, método de, 133 


unscented (filtro de Kalman), 362 


validação de modelos, 43, 79, 82, 459, 
640 

em malha aberta, 506 

em malha fechada, 506 
valor quadrático médio, 265 
variáveis instrumentais, 301 
variância, 265 
variância mínima 

de estimador MQ, 272 
vetor de estado, 64, 121, 124 
vetores 

ortogonais, 669 
viés (ver polarização), 250, 679 


zeros de uma FT, 95, 96 


Digitalizado com CamScanner 


